更新变动及进度

JuseKit 故事传之开学第一天,我在课题组实验室搞新功能。

已有功能的相关教程请见:Juseの软件开发

本文所涉及功能借鉴了 Trinity 脚本的输出格式。

本次更新变动

  • 完善了部分报错提示。
  • 完善了部分文本显示。
  • 新增了转录组组装指标计算功能。

目前的功能进度

  • 提取最长转录本。
  • 根据 id 提取序列。
  • 对序列的 id 进行各种处理。
  • 串联序列并得到分区信息。
  • 批量进行序列格式转换。
  • 批量提取 Orthofinder 的 orthogroup 对应的 CDS 序列。
  • 批量进行序列的物种数和长度过滤。
  • 火山图绘制。
  • 气泡图绘制。
  • 组装指标计算。

叠盾警告⚠:本软件解释权归属 Juse 所有,本软件能走多远具体得看 Juse 能坚持多久。

下载地址:https://github.com/JuseTiZ/JuseKit/releases

转录组组装指标计算

本文主要着重于这次更新新增的功能,其他模块请走这里

要求的数据

需要输入的数据为 fasta 格式的序列文件。

可通过将文件拖拽至文本框或者点击右侧按钮读取文件路径。

操作示例:

结果文件会产生在序列文件的同一路径下,文件名为 assem_qc.txt

目前返回的信息包括:

  • 基因数量
  • 最大长度、最小长度和平均长度
  • Nxx 值
  • GC 含量

以后视情况会继续完善这一功能,例如补充其他可以反应转录组组装质量的指标。

进阶应用

这一部分就相当于取最长转录本,关于该概念可见以往文章。

此处我将使用 _seq 作为基因标识进行(老版 Trinity 的序列格式):

在指定基因标识后 JuseKit 会将每个基因的最长 Contig 作为其代表序列进行各指标计算。

如果在使用前后指标没有变化则说明该标识并不存在或者输入错误。

后记

后记?这次啊,没有后记!

最后是复制黏贴:

我会争取将这些功能慢慢完善,让它成为一个具有更广适用性的软件,希望能够帮助到某些盆友,当然我个人认为最大的可能是自娱自乐。

如果这个软件帮助到您了,您可以给它一个小小的 Star 聊表支持,或者在您汇报的时候引一下 https://github.com/JuseTiZ/JuseKit/ ,想必看着还是非常高端大气上档次的。