吳育瑋老師學術分享:微生物體基因序列分析

吳育瑋助理教授於2012年8月從美國印第安那大學布魯明頓分校取得生物資訊博士學位,並在加州柏克萊美國國家實驗室進行為期4年的博士後研究工作後,於2016年10月至本校任教,現為醫學科技學院醫學資訊研究所助理教授。(編按)

自2009年起,我的研究就完全聚焦於微生物體的計算分析上。次世代定序技術的日漸成熟,大幅促成各種生物基因體定序計畫的發展,而越來越多的微生物體也從各種自然或人體環境中定序出來。然而,人們所知的細菌種類仍然相當有限,數據顯示我們所知的細菌只佔所有細菌的不到1%,造成微生物體的分析,截至目前為止仍然是件相當困難的工作。

微生物體的分析難度主要來自於各種細菌基因序列的混雜。試著想像一盒高難度的拼圖:一般人或許需要花上一、兩個禮拜甚至一個月去拼湊這幅拼圖,再將幾百盒完全不同的高難度拼圖碎片全部混在一起;而將這幾百盒完全不同的拼圖全部拆解並拼湊出來的複雜度,就是我們在分析微生體時遇到的難度。【圖:醫學資訊研究所吳育瑋助理教授】

為了解決這個問題,我開發出了一種分群演算法「MaxBin」,運用機率分析與機器學習演算法將微生物體基因序列進行分類,以簡化後續的各種分析與處理。以拼圖來說,就是將幾百盒混在一起的拼圖分類為幾百堆,每堆只包含來自一種拼圖的碎片。這種方法能夠大幅降低後續的分析複雜度,並藉由分群後的個別基因體促成我們對未知物種的認知。

MaxBin已於2014年發表在《微生物期刊》上(Microbiome 2:26, 2014);第二版MaxBin 2.0也在2016年發表於《生物信息學期刊》(Bioinformatics 32(4):605-607)。截至2017月4月27日止,MaxBin已被引用164次(Google Scholar; MaxBin 108次;MaxBin 2.0 56次),顯示其被廣泛地運用在各種微生體研究上。其準確性更受到國際專家學者的肯定:一項國際性的軟體評比結果指出MaxBin在分類個別細菌上「有著最高的準確率」,而且「能夠最精準地分類細菌」(Nature Methods 14: 1063-1071, 2017)。

我也運用自己開發的軟體分析了數個微生物體,並將研究成果發表在各國際期刊上(BioEnergy Res 8(3): 1031-1035, 2015;AEM 82(1): 255-267, 2016; ISME 10:833-845, 2016; mBio 7(4): e01106-16, 2016; mSystems 1(6): e00120-16, 2016; Nature Microbiology: in press)。未來我計畫繼續開發與維護這套軟體,讓它持續在微生物體的計算分析上扮演著不可或缺的角色。(文/吳育瑋,醫學科技學院醫學資訊研究所助理教授)

分類: 前期, 前期:學術分享。這篇內容的永久連結