将 fasta 序列解析到字典中

2023-12-22

我需要最简单的解决方案来转换包含多个核苷酸序列的 fasta.txt，例如

>seq1
TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG
CTTTCTGATAATTGATAGCATACGCTGCGAACCCACGGAAGGGGGTCGAGGACAGTGGTG
>seq2
TCCCTCTAGAGGCTCTTTACCGTGATGCTACATCTTACAGGTATTTCTGAGGCTCTTTCA
AACAGGTGCGCGTGAACAACAACCCACGGCAAACGAGTACAGTGTGTACGCCTGAGAGTA
>seq3
GGTTCCGCTCTAAGCCTCTAACTCCCGCACAGGGAAGAGATGTCGATTAACTTGCGCCCA
TAGAGCTCTGCGCGTGCGTCGAAGGCTCTTTTCGCGATATCTGTGTGGTCTCACTTTGGT

到字典（名称，值）对象，其中名称将是>标头，值将分配给相应的序列。

您可以在下面找到我失败的尝试，通过 2 个列表执行此操作（不适用于包含 >1 行的长序列）

f = open('input2.txt', 'r')
list={}
names=[]
seq=[]
for line in f:
 if line.startswith('>'):
  names.append(line[1:-1])
 elif line.startswith('A') or line.startswith('C') or line.startswith('G') or line.startswith('T'):
  seq.append(line)

list = dict(zip(names, seq))

如果您向我提供如何修复它的解决方案以及如何通过单独的函数执行此操作的示例，我将不胜感激。

感谢帮助，

Gleb

最好使用biopython库

from Bio import SeqIO
input_file = open("input.fasta")
my_dict = SeqIO.to_dict(SeqIO.parse(input_file, "fasta"))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Dictionary

fasta

将 fasta 序列解析到字典中的相关文章

Python BigQuery 存储。并行读取多个流

我有以下玩具代码 import pandas as pd from google cloud import bigquery storage v1beta1 import os import google auth os environ G
Python、Tkinter、更改标签颜色

有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容是否存在类似的颜色变化 button color red Use the foreground设置按钮
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数

随机推荐

即时创建 Excel 文件并将其下载/保存在客户端上

Question ASP NET Core 1 1 中以下代码的最后三行的替代方案是什么和或解决方法是什么在这最后三行VS2015正在抱怨HttpResponse does not contain a definition for Ou
Linux 的图形 DIFF 程序 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
搜索非 ASCII 文档

我的计算机上的应用程序需要读入文本文件我有好几个其中一个不起作用该程序无法读取它并告诉我其中某个地方有一个坏字符我的第一个猜测是那里有一个非 ASCII 字符但我不知道如何找到它 Perl 或任何通用正则表达式都会很好有任何想法
插入到不同服务器上的 MySQL 数据库

在 mysite1 com 上运行的脚本中使用 PHP 和 MySQL 我尝试将 mysite2 com 上的表中的所有行和列复制到 mysite1 com 上的相同表已创建中首先我连接到两个数据库我已经在 mysite2 com
Laravel 5 的 wherePivot 问题

我正在使用 Laravel 5 但遇到问题 gt wherePivot 处理多对多关系当我dd 该 SQL 看起来 Eloquent 正在数据透视表中查找具有 pose state 的记录 pose id 为 null 我希望这是一个简单
无法从类型 [java.lang.Object[]] 转换为类型

我有 Spring Web 应用程序 JPA Hibernate MySQL 我有两个 DAO 类客户DAO Entity Table name customers public class Customer Id Column name
iOS 14 小部件中的动画

我找不到在小部件中实现 ProgressBar 的解决方案我明白了如果文本组件的类型为 timer 则应该更改该组件我看到默认的小部件时钟带有漂亮的移动箭头动画但是我可以在小部件中实现自定义动画吗根据框架工程师的说法开发者苹果论
PHP 中 MySQL 二进制 GEOMETRY 字段的转换

我正在开发一个集成 Mapquest 地图并使用 Mapquest API 的应用程序目前我想实现以下目标注册用户必须输入纬度和经度信息并且在数据库中该信息必须存储为几何类型字段相反查看其帐户的用户应该会看到输入的纬度和经度信息
将命名元组转换为字典

我在 python 中有一个命名元组类 class Town collections namedtuple Town name population coordinates population capital state bird 我想将
如何通过Core Data模型动态创建新的实体（表）？

我想在 SQLite 中创建一个新的实体表我的代码如下 BOOL CreateDataSet NSManagedObjectModel model attributes NSDictionary attributes entityNam
在android中以编程方式打开和关闭屏幕

我想根据接近传感器打开和关闭屏幕我可以关闭屏幕但打开屏幕的代码不起作用有人可以帮我吗这是代码 public void onSensorChanged SensorEvent event if event values 0 0 Toa
JVM 错误：进程已完成，退出代码为 134（被信号 6 中断：SIGABRT）

我在 intellij 上使用 openjdk 11 javafx 11 每次我尝试运行需要 javafx 的代码时都会收到此错误经过一番谷歌搜索后它似乎与显示服务器有关 xorg 使用 archlinux kde 5 但我找不到任何
asp.net mvc tinymce 用法？

scripts
如何在 Objective-C 中将 NSString 与字符一一转换为 NSArray [重复]

这个问题在这里已经有答案了我想转换NSString ex HELLO to NSArray ex H E L L O nil 首先我尝试使用componentsSeparatedByString 但它需要指示分隔符所以我不能我怎样才
如何提高ngFor循环的性能？

当 ngFor 应该渲染 7600 个字符串项时性能非常慢浏览器会冻结几秒钟是否有可能提高 ngFor 的性能 ng代码 ul class nano drop down list li class nano f r nano f 30
如何查询 MongoDB 集合上的日期范围，其中 ISO 日期存储在字符串字段中？

Scenario 考虑我有一个名为MyCollection 具有以下数据 id MyUniqueID 01 CreatedTime 2013 12 01T14 35 00Z LastModifiedTime 2013 12 01T13 25
MarkLogic 8 - 将大型结果集流式传输到文件 - JavaScript - Node.js 客户端 API

假设我有一个查询将返回一个非常大的响应可能有数千条记录也可能有千兆字节的数据通常在用户界面中我们只显示该数据的单个页面现在我需要一个选项来获取整个结果集并将其流式传输到文件中然后用户可以在闲暇时去下载这个那么如何使用查询生成
PHP Post 和使用 cURL 重定向与 HTML 表单相同[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 在 HTML 中我们可以创建一个表
多阶段 Docker：RUN wget 与 ADD

The Docker 文档的最佳实践部分 https docs docker com engine userguide eng image dockerfile best practices 说由于图像大小很重要因此使用 ADD 从远程
将 fasta 序列解析到字典中

我需要最简单的解决方案来转换包含多个核苷酸序列的 fasta txt 例如 gt seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG CTTTCTGATAATT

将 fasta 序列解析到字典中

将 fasta 序列解析到字典中 的相关文章

随机推荐

热门标签

将 fasta 序列解析到字典中的相关文章