将 fasta 序列解析到字典中

2023-12-22

我需要最简单的解决方案来转换包含多个核苷酸序列的 fasta.txt,例如

>seq1
TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG
CTTTCTGATAATTGATAGCATACGCTGCGAACCCACGGAAGGGGGTCGAGGACAGTGGTG
>seq2
TCCCTCTAGAGGCTCTTTACCGTGATGCTACATCTTACAGGTATTTCTGAGGCTCTTTCA
AACAGGTGCGCGTGAACAACAACCCACGGCAAACGAGTACAGTGTGTACGCCTGAGAGTA
>seq3
GGTTCCGCTCTAAGCCTCTAACTCCCGCACAGGGAAGAGATGTCGATTAACTTGCGCCCA
TAGAGCTCTGCGCGTGCGTCGAAGGCTCTTTTCGCGATATCTGTGTGGTCTCACTTTGGT

到字典(名称,值)对象,其中名称将是>标头,值将分配给相应的序列。

您可以在下面找到我失败的尝试,通过 2 个列表执行此操作(不适用于包含 >1 行的长序列)

f = open('input2.txt', 'r')
list={}
names=[]
seq=[]
for line in f:
 if line.startswith('>'):
  names.append(line[1:-1])
 elif line.startswith('A') or line.startswith('C') or line.startswith('G') or line.startswith('T'):
  seq.append(line)

list = dict(zip(names, seq))

如果您向我提供如何修复它的解决方案以及如何通过单独的函数执行此操作的示例,我将不胜感激。

感谢帮助,

Gleb


最好使用biopython库

from Bio import SeqIO
input_file = open("input.fasta")
my_dict = SeqIO.to_dict(SeqIO.parse(input_file, "fasta"))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将 fasta 序列解析到字典中 的相关文章

  • Python BigQuery 存储。并行读取多个流

    我有以下玩具代码 import pandas as pd from google cloud import bigquery storage v1beta1 import os import google auth os environ G
  • Python、Tkinter、更改标签颜色

    有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容 是否存在类似的颜色变化 button color red Use the foreground设置按钮
  • Pycharm Python 控制台不打印输出

    我有一个从 Pycharm python 控制台调用的函数 但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面 像
  • DreamPie 不适用于 Python 3.2

    我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用 我使用了 添加解释器 DreamPie 应用程序并添加了 Python 3 2
  • 导入错误:没有名为 _ssl 的模块

    带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
  • 如何使用 Scrapy 从网站获取所有纯文本?

    我希望在 HTML 呈现后 可以从网站上看到所有文本 我正在使用 Scrapy 框架使用 Python 工作 和xpath body text 我能够获取它 但是带有 HTML 标签 而且我只想要文本 有什么解决办法吗 最简单的选择是ext
  • 为 pandas 数据透视表中的每个值列定义 aggfunc

    试图生成具有多个 值 列的数据透视表 我知道我可以使用 aggfunc 按照我想要的方式聚合值 但是如果我不想对两列求和或求平均值 而是想要一列的总和 同时求另一列的平均值 该怎么办 那么使用 pandas 可以做到这一点吗 df pd D
  • 从 scikit-learn 导入 make_blobs [重复]

    这个问题在这里已经有答案了 我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
  • Python 中的二进制缓冲区

    在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区 内存映射文件 https docs python org library mmap
  • 在pyyaml中表示具有相同基类的不同类的实例

    我有一些单元测试集 希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求 但测试属于不同的套装 结果有不同的父类 这是我所拥有的示例 gt gt gt rz shorthand for
  • Python:字符串不会转换为浮点数[重复]

    这个问题在这里已经有答案了 我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
  • 当玩家触摸屏幕一侧时,如何让 pygame 发出警告?

    我使用 pygame 创建了一个游戏 当玩家触摸屏幕一侧时 我想让 pygame 给出类似 你不能触摸屏幕两侧 的错误 我尝试在互联网上搜索 但没有找到任何好的结果 我想过在屏幕外添加一个方块 当玩家触摸该方块时 它会发出警告 但这花了很长
  • 如何将 numpy.matrix 提高到非整数幂?

    The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
  • Python:尝试检查有效的电话号码

    我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字 现在我有了这个 如果启动不正确 它将允许您重新输入正确的数字 然后它会翻译输入的原始数字 我该如何解决 def main phon
  • Numpy 优化

    我有一个根据条件分配值的函数 我的数据集大小通常在 30 50k 范围内 我不确定这是否是使用 numpy 的正确方法 但是当数字超过 5k 时 它会变得非常慢 有没有更好的方法让它更快 import numpy as np N 5000
  • Python:计算字典的重复值

    我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
  • 从 Python 中的类元信息对 __init__ 函数进行类型提示

    我想做的是复制什么SQLAlchemy确实 以其DeclarativeMeta班级 有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
  • 您可以在 Python 类型注释中指定方差吗?

    你能发现下面代码中的错误吗 米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
  • Spark.read 在 Databricks 中给出 KrbException

    我正在尝试从 databricks 笔记本连接到 SQL 数据库 以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
  • Python - 字典和列表相交

    给定以下数据结构 找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出 我可以将列表 不是 dict1 组织到任何其他数

随机推荐

  • 即时创建 Excel 文件并将其下载/保存在客户端上

    Question ASP NET Core 1 1 中以下代码的最后三行的替代方案是什么和 或解决方法是什么 在这最后三行VS2015正在抱怨HttpResponse does not contain a definition for Ou
  • Linux 的图形 DIFF 程序 [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 搜索非 ASCII 文档

    我的计算机上的应用程序需要读入文本文件 我有好几个 其中一个不起作用 该程序无法读取它并告诉我其中某个地方有一个坏字符 我的第一个猜测是那里有一个非 ASCII 字符 但我不知道如何找到它 Perl 或任何通用正则表达式都会很好 有任何想法
  • 插入到不同服务器上的 MySQL 数据库

    在 mysite1 com 上运行的脚本中使用 PHP 和 MySQL 我尝试将 mysite2 com 上的表中的所有行和列复制到 mysite1 com 上的相同表 已创建 中 首先 我连接到两个数据库 我已经在 mysite2 com
  • Laravel 5 的 wherePivot 问题

    我正在使用 Laravel 5 但遇到问题 gt wherePivot 处理多对多关系 当我dd 该 SQL 看起来 Eloquent 正在数据透视表中查找具有 pose state 的记录 pose id 为 null 我希望这是一个简单
  • 无法从类型 [java.lang.Object[]] 转换为类型

    我有 Spring Web 应用程序 JPA Hibernate MySQL 我有两个 DAO 类 客户DAO Entity Table name customers public class Customer Id Column name
  • iOS 14 小部件中的动画

    我找不到在小部件中实现 ProgressBar 的解决方案 我明白了 如果文本组件的类型为 timer 则应该更改该组件 我看到默认的小部件时钟 带有漂亮的移动箭头动画 但是我可以在小部件中实现自定义动画吗 根据框架工程师的说法开发者苹果论
  • PHP 中 MySQL 二进制 GEOMETRY 字段的转换

    我正在开发一个集成 Mapquest 地图并使用 Mapquest API 的应用程序 目前我想实现以下目标 注册用户必须输入纬度和经度信息 并且在数据库中该信息必须存储为几何类型字段 相反 查看其帐户的用户应该会看到输入的纬度和经度信息
  • 将命名元组转换为字典

    我在 python 中有一个命名元组类 class Town collections namedtuple Town name population coordinates population capital state bird 我想将
  • 如何通过Core Data模型动态创建新的实体(表)?

    我想在 SQLite 中创建一个新的实体 表 我的代码如下 BOOL CreateDataSet NSManagedObjectModel model attributes NSDictionary attributes entityNam
  • 在android中以编程方式打开和关闭屏幕

    我想根据接近传感器打开和关闭屏幕 我可以关闭屏幕 但打开屏幕的代码不起作用 有人可以帮我吗 这是代码 public void onSensorChanged SensorEvent event if event values 0 0 Toa
  • JVM 错误:进程已完成,退出代码为 134(被信号 6 中断:SIGABRT)

    我在 intellij 上使用 openjdk 11 javafx 11 每次我尝试运行需要 javafx 的代码时 都会收到此错误 经过一番谷歌搜索后 它似乎与显示服务器有关 xorg 使用 archlinux kde 5 但我找不到任何
  • asp.net mvc tinymce 用法?

    scripts
  • 如何在 Objective-C 中将 NSString 与字符一一转换为 NSArray [重复]

    这个问题在这里已经有答案了 我想转换NSString ex HELLO to NSArray ex H E L L O nil 首先 我尝试使用componentsSeparatedByString 但它需要指示分隔符 所以我不能 我怎样才
  • 如何提高ngFor循环的性能?

    当 ngFor 应该渲染 7600 个字符串项时 性能非常慢 浏览器会冻结几秒钟 是否有可能提高 ngFor 的性能 ng代码 ul class nano drop down list li class nano f r nano f 30
  • 如何查询 MongoDB 集合上的日期范围,其中 ISO 日期存储在字符串字段中?

    Scenario 考虑我有一个名为MyCollection 具有以下数据 id MyUniqueID 01 CreatedTime 2013 12 01T14 35 00Z LastModifiedTime 2013 12 01T13 25
  • MarkLogic 8 - 将大型结果集流式传输到文件 - JavaScript - Node.js 客户端 API

    假设我有一个查询将返回一个非常大的响应 可能有数千条记录 也可能有千兆字节的数据 通常在用户界面中 我们只显示该数据的单个页面 现在我需要一个选项来获取整个结果集并将其流式传输到文件中 然后用户可以在闲暇时去下载这个 那么 如何使用查询生成
  • PHP Post 和使用 cURL 重定向与 HTML 表单相同[关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 在 HTML 中 我们可以创建一个表
  • 多阶段 Docker:RUN wget 与 ADD

    The Docker 文档的最佳实践部分 https docs docker com engine userguide eng image dockerfile best practices 说 由于图像大小很重要 因此使用 ADD 从远程
  • 将 fasta 序列解析到字典中

    我需要最简单的解决方案来转换包含多个核苷酸序列的 fasta txt 例如 gt seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG CTTTCTGATAATT