跳至主要內容
生信中的Python——如何处理一大堆判断?

好久没更新博客了! 前段时间我突然来了兴致,把博客的后端彻底翻新了一遍。现在用的是一个比较新的博客框架,界面看着还挺养眼的。昨天看到一个很有意思的话题,怎么简化一大堆判断?所以准备写这个博客简单讨论一下。

写在前面

昨天我和薏米看了动画片《Coco》,中文是《寻梦环游记》,看完后感触颇深。片中的一个观点让我印象深刻:一个人的死亡并不意味着真正的消失,因为ta的灵魂会到达另一个世界。作为一个搞科研的,我当然明白这种说法缺乏依据。但更让我感到惋惜的是,一个人离世后,在人间可能就没几个人会记得ta了。我忽然想到,对于上一辈,特别是更早以前的老人们来说,受限于时代,他们在世时留下的痕迹可能寥寥无几,最多是些家中为数不多的遗物。像我对爷爷的印象已经相当模糊,对太爷就基本只能从父亲的只言片语中拼凑些许。那个年代,很多人连张像样的照片都没机会留下。


Haopeng Yu大约 5 分钟Python
生信中的Python——正则表达式与GQS预测

正则表达式算是我最常用的代码技巧吧,因为经常需要文本的模式匹配(就是查找某种字符串)。从我的经验,正则表达式很强大,效率也很高。最近有一个查找转录组中的GQS的项目,正好整理一下正则表达式。

  • 基础匹配
  • 前向断言
  • Kmer

写在前面:

我准备用Python来实现,其实各个语言的正则表达式(Regular expression)语法差异都不大。我不准备写太多基础的东西,就像文档教程那么难看,我就写一些实用的东西。

基础匹配


Haopeng Yu大约 5 分钟Python
生信中的python——从基因组中提目标序列

昨天组会后,和同门讲起曾经我刚进实验室的辛酸历程。2G内存的小服务器,硬是让我做人类基因组数据,于是写程序必须各种优化还得注意控制内存。所以有了今天的想法,聊聊怎么从基因组中提序列。实现的功能不重要,主要是讲一下怎么处理大文件,真正提序列可以用samtools等现有软件,不用重复造轮子。

  • 问题描述
  • 读取大文件
  • 从简单的开始
  • Unittest单元测试

写在前面:

有人给我打赏了!!!!

感谢感谢,希望我的内容对你们有帮助。我平时忙起来特别忙,闲起来特别闲=-=,如果有几个小时的空闲与其看个电影不如写写博客,自己也能学习一下。


Haopeng Yu大约 8 分钟Python
生信中的Python——定位polyN

马上快毕业了,师妹跟我聊说她现在程序还是不太会写,让我在撤退之前给她补救一下;同时,老婆大人突然励志要奋发努力的学程序,所以我准备推出一系列生信代码教程。主要是通过一些示例,写一下我写生信程序的思路和经验,并不包括具体的语法。第一个就写一个有关polyN定位的例子,示例来自于已经工作的孟师妹问我的一个问题,在此与大家分享。

  • 生信案例描述
  • 最直接的解决方案
  • 适用于更多情况

写在前面:

我并不想把python的语法或者什么再重复一遍,没有任何意义。现在描述python基本语法的教学网站很多,我推荐几个吧:


Haopeng Yu大约 15 分钟Python
生物信息专业如何自学Python语言

那么,接下来,我就从我个人的经验为大家说一下怎么学习Python:

  • 做生信为什么要学Python?
  • 学Python从哪入手?
  • 学Python的工具推荐(python安装、IDE等)
  • 最后几个小问题

时间过的好快,上一篇博客还是17年9月写的,现在已经到了18年4月。 这段时间,我已经全面的把机器学习和深度学习融入到我的研究中了,因为我发现这东西实在太神奇了。 做这两个“学习”,我都是用python写的,因为现在各大深度学习平台对Python支持略高,毕竟好学。


Haopeng Yu大约 6 分钟Python