# Guideline-for-Computational-Biology-and-Bioinformatics **Repository Path**: guocheng2020/Guideline-for-Computational-Biology-and-Bioinformatics ## Basic Information - **Project Name**: Guideline-for-Computational-Biology-and-Bioinformatics - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-03-07 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Guideline-for-Computational-Biology-and-Bioinformatics **目的**: 在原来的 [GCCS2019](https://github.com/gao-lab/Guideline-for-Computational-Biology-and-Bioinformatics/blob/master/pdf/190317-guideline_for_common_computational_skills.pdf) 基础上对组内培养方案更具体的完善,大概会包括如何达到 GCCS2019 中的要求中的basic,advanced skills。 Ps. 对于一开始进组开始 intern 的同学建议全部掌握 Basic skills 且最好掌握部分 Advanced skills,basic skills 是能开始工作的基础,Advanced skills 是能做出原创性工作的前提。 ## Table of contents - [ Guideline-for-Computational-Biology-and-Bioinformatics](#head1) - [Basic Skills](#head2) - [Linux Foundation](#head3) - [ Python](#head4) - [ R](#head5) - [ Writing](#head6) - [Basic Math](#head7) - [Advanced skill](#head8) - [Machine Learning](#head9) - [Statistical Learning ](#head10) - [Deep Learning](#head11) - [ Bayes](#head12) - [Reinforce Learning](#head13) - [Bioinformatics Analysis](#head14) - [Some Courses ](#head15) - [Related links](#head16) - [ People](#head17) ## Basic Skills 这部分是能够开展工作的基础,至少需要了解的部分。 ### Linux Foundation 对于 Linux 需要掌握一些最基础的基本操作,以及关于服务器的一些基本的常识。 * [Linux basic](https://github.com/Gao-lab/Guideline-for-Computational-Biology-and-Bioinformatics/blob/master/pdf/Linux_Basics_2019.pdf) 和 [linux shortenned](https://github.com/Gao-lab/Guideline-for-Computational-Biology-and-Bioinformatics/blob/master/pdf/linux_shortened.pdf) 都是基本的 Linux 知识,建议快速的看一遍,然后上手试一试,北大未名有免费的学生账号,可以[申请](http://hpc.pku.edu.cn/guide.html) ### Python Basic 的 Python ,只需要掌握基本的语法,以及常见的 package 比如 numpy, pandas 的基础用法即可。 * [Basic Python](https://www.learnpython.org) 中文版本 [[link]](http://www.runoob.com/python/python-tutorial.html) * [Python 100 days](https://github.com/jackfrued/Python-100-Days) 已经是很完整的 Python 的资料了,包括的内容非常多,basic 的话不需要全部掌握。 * [Think python](https://greenteapress.com/wp/think-python-2e/),另外也有中文版,自行搜索就能找到。 ### R * [R for beginners](http://ape-package.ird.fr/ep/R4beg_cn_2.0.pdf) 适合初学者入门。 ### Writing * Markdown/Rmarkdown Markdown 感觉是轻量级 LaTeX,最主要的就是也能支持数学公式。推荐 typora!来写 Markdown。 * LaTeX LaTeX 基础的话推荐 [Basic latex](https://github.com/gao-lab/Guideline-for-Computational-Biology-and-Bioinformatics/blob/master/pdf/LaTeX_basic.pdf) 看完这个,LaTeX 的基本的使用不成问题!如果想要尝试的话可以推荐使用 [Overleaf](https://www.overleaf.com),上面有很多的 template 可以直接用。 ### Basic Math * 高等数学 * 线性代数 * 概率论与数理统计 ## Advanced skill Advanced skill 是在 Basic skill 的基础上的进阶,包括机器学习,统计学习,深度学习,贝叶斯理论,概率图模型,同学们按照自己的兴趣挑选学习即可。 *ps. 如何做出有价值的,其他人没想到的工作呢 1.你比人家聪明,2.你比人家知道的多。相比第一条,第二条是更容易实现的* ### Machine Learning 使用机器学习/统计学习方法挖掘组学数据其实就是生物信息做的事情,所以machine learning某种程度上也是 basic skill! 这部分资料其实非常多,Google 随便搜索一下就能找到很多,下面简单的罗列一下我知道的,或者我看过觉得不错的的资料。 * Mooc * Coursera 上 Andrew Ng 的 Machine learning,深入浅出相当不错,建议快速刷完。[machine learning](https://www.coursera.org/learn/machine-learning) ,另外国内网易云上,bilibili上都有搬运的资料。 * [**machine-learning-notes**](https://github.com/roboticcam/machine-learning-notes) 只要是里面有视频的部分讲的都非常清楚(Variational Inference, MC等)!而且中文格外亲切。 * Book * Pattern recognition and machine learning[(PRML)](https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=2ahUKEwjQvt-LutXkAhXQxosBHUxaAcAQFjAAegQIAxAC&url=http%3A%2F%2Fusers.isr.ist.utl.pt%2F~wurmd%2FLivros%2Fschool%2FBishop%2520-%2520Pattern%2520Recognition%2520And%2520Machine%2520Learning%2520-%2520Springer%2520%25202006.pdf&usg=AOvVaw2j0fMGPbFfpcwGzqELtiRU) ### Statistical Learning 统计学习和机器学习其实没什么区别吧,因为毕竟有"统计"两个字,所以看起来更加令人信服! * 李航的[统计学习](https://book.douban.com/subject/33437381/),短小精悍!建议专心读几天,一口气读完。 * [Statistical Rethinking: A Bayesian Course Using R and Stan](https://github.com/rmcelreath/statrethinking_winter2019)这其中包括 slides, videos, homework(solution)。 * [Introduction to Statistical Learning with R](http://www-bcf.usc.edu/~gareth/ISL/ISLR%20First%20Printing.pdf) 这本比较简单,也有中文翻译版本,也是某种意义上李程老师的基因组数据分析所用的教材。 * [The Element of Statistical Learning](https://web.stanford.edu/~hastie/Papers/ESLII.pdf) 这本书比 ISL 更难,有更多的数学,而且中文版感觉翻译的不是很好,另外也是林伟老师的统计学习的教材. ### Deep Learning * Coursera 上面的 [Deep Learning](https://www.coursera.org/specializations/deep-learning), Andrew Ng 讲的还是非常好的,另外 [bilibili](https://www.bilibili.com/video/av49445369?from=search&seid=853459819773787018) 上也有搬运的。另外网易云上应该也有。 * 李沐的[动手学深度学习](https://zh.gluon.ai),框架使用的是MXNET,所以可能这部分借鉴意义不大,但是本身来说写的还是不错的,比那本非常有名的 deep learning 更适合学习。 * [Solution of Deep-Learning-Coursera](https://github.com/DeepakSridhar/Deep-Learning-Coursera) * [Awesome - Most Cited Deep Learning Papers](https://github.com/terryum/awesome-deep-learning-papers) Deep learning 中经典的论文 ### Bayes 贝叶斯学派和频率学派的本质区别就是认为 parameter 没有确定的值,有的是分布。 * [Bayesian Data Analysis](https://www.amazon.com.au/Bayesian-Analysis-Chapman-Statistical-Science-ebook/dp/B00I60M6H6) 这本书内容比较多,是席瑞斌老师的贝叶斯的参考书。 * [Awesome Bayes](https://github.com/dimenwarper/awesome-bayes) 里面包括非常多的关于贝叶斯的资源 * [Think 系列](https://greenteapress.com/wp/) 中的 [Think Bayes](https://greenteapress.com/wp/think-bayes/) ### Reinforce Learning * [Stanford Reinforce Learning](http://web.stanford.edu/class/cs234/index.html) ## Bioinformatics Analysis * Single Cell Analysis * [Single cell RNA-seq course by sanger institute](https://scrnaseq-course.cog.sanger.ac.uk/website/index.html) * [Scanpy Tutorials](https://scanpy.readthedocs.io/en/stable/tutorials.html) * [Seurat - Guided Clustering Tutorial](https://satijalab.org/seurat/v3.1/pbmc3k_tutorial.html) * [awesome-single-cell](https://github.com/seandavi/awesome-single-cell) * Others * [awesome multi omics](https://github.com/mikelove/awesome-multi-omics) ## Some Courses * Computational Biology Courses * [MIT Foundations of computational and systems biology](https://ocw.mit.edu/courses/biology/7-91j-foundations-of-computational-and-systems-biology-spring-2014/) * [stanford Computational Biology in Four Dimensions](https://cs371.stanford.edu/index.html) Computational biology 的一些topic。 * Courses at Peking University * [北京大学基因组学、生物信息学课程](http://bioinfocore.cbi.pku.edu.cn/forum/upload/forum.php?mod=viewthread&tid=325&extra=page%3D1) by 李程老师 * 基因组生物学技术 * 贝叶斯理论与算法 * 深度学习:算法与应用 * 生物信息中的数学模型与方法 * 基因组学数据分析 * 生物数学物理 * 统计学习 * 生物数学建模 * 生物信息学方法 ## Related links * [selection of books/urls for bioinformatics/data science curriculum](https://divingintogeneticsandgenomics.rbind.io/post/my-opinionated-selection-of-books-for-bioinformatics-data-science-curriculum/) by Ming Tang * [A New Online Computational Biology Curriculum](https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003662) * [Awesome Bioinformatics](https://github.com/danielecook/Awesome-Bioinformatics) * [Awesome-Bio-ML-PKU](https://github.com/XinmingTu/Awesome-Bio-ML-PKU) ## People * [屠鑫明](https://xinmingtu.cn) * 陈子玉 * 曹智杰 * 丁阳