生物信息學的研究意義范文
時間:2023-12-21 17:37:37
導語:如何才能寫好一篇生物信息學的研究意義,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
【關鍵詞】生物信息學;特異性miRNA;動脈粥樣硬化
醫(yī)學生物信息學是是研究、開發(fā)和應用計算機工具和方法來擴展生物學、醫(yī)學、行為學和健康知識應用的科學,包括獲得、儲存、組織、存檔、分析或使這些材料形象化多種學科相互交匯而成的新型學科,并最終能夠為臨床疾病的診治提供幫助[1]。動脈粥樣硬化是臨床上較常見到的一類病癥號稱 “21世紀健康殺手”,特別在現(xiàn)在中國老年群中,發(fā)病率逐年上升,也是引發(fā)心肌梗死、腦卒中的主要病因之一[2]。因此,對脈粥樣硬化的早期診斷、預防就顯得十分重要。微小RNA簡稱為miRNA[3],這種非編碼RNA具有調(diào)節(jié)其他基因表達的作用,在轉(zhuǎn)錄后可以將多個靶基因的表達高效的調(diào)控,具有非常高的研究與應用價值。因此如能對動脈粥樣硬化發(fā)生發(fā)展過程異性表達的miRNA進行生物信息學篩查,無疑是對早期檢測動脈粥樣硬化具有重要意義。
1資料與方法
1.1資料來源miRBase作為目前最權威和完整的miRNA數(shù)據(jù)庫(http:///miRDB/),已經(jīng)收錄了一百余個物種中超過10000條的miRNA記錄。數(shù)據(jù)庫主要由3部分組成:miRBase:Registry,主要是用于提交新的miRNA序列;miRBase:Database,用來搜索、比對、下載所有已知miRNA相關信息的數(shù)據(jù)庫,包括成熟序列、前體序列、前體二級結(jié)構、基因組位置、相關文獻等等,并可進行BLAST搜索、FTP下載。miRBase:Targets,存放了所有miRNA靶基因的信息。目前已經(jīng)移至EBI,并更名為microCosm。但主要收錄了動物miRNA的靶基因信息。
1.2操作環(huán)境使用微軟公司的Access作為數(shù)據(jù)庫管理系統(tǒng)平臺,操作系統(tǒng)為微軟公司的windowsXP。以miRBase數(shù)據(jù)庫作為初級數(shù)據(jù)庫,利用miRanda,TargetScan,Pictar、microTar,結(jié)合動脈粥樣硬化的三大學說中的關鍵基因進行預測。
1.3數(shù)據(jù)獲取首先,對數(shù)據(jù)庫中Web站點進行登錄,并進行動脈粥樣硬化關鍵詞搜索配對,訪問數(shù)據(jù)庫中的相關有效信息。逐條對搜索結(jié)果進行詳細查看與記錄,對于有用的信息可以通過文檔下載,并手工記錄。最后,將記錄、分析后的資源納入到二級數(shù)據(jù)庫中。
1.4數(shù)據(jù)收集整理主要處理的數(shù)據(jù)為miRNA序列,對miRNA序列條目的字段組成、名稱、其他常用標識、靶基因定位、功能描述、等相關資料進行收集保存。實際操作中,由于字段組成通常較為復雜,因此不能夠直接對資料進行簡單的表格記錄。造成這種情況的主要原因主要是該序列并不只有一個實驗者進行研究。因此,這些字段將被導入單獨的數(shù)據(jù)表,以序列編號字段作為鍵,與和基本信息數(shù)據(jù)表保持聯(lián)系。同樣,與序列特征相關的注釋信息也以單獨的數(shù)據(jù)表表示。
1.5數(shù)據(jù)查新維護因為生物信息學信息增長較快,因此需要對數(shù)據(jù)庫進行定期的篩查,以保證相關數(shù)據(jù)的時效性。通常情況下,半個月需要對數(shù)據(jù)庫中的相關信息進行一次更新工作。
2結(jié)果
到2013年1月31日,目前動脈粥樣硬化相關基因以及中以錄入其中根據(jù)致病基因24個,密切相關基因78個,候選基因25個。對上述基因及其特異性的miRNA進行預測得到下列在動脈粥樣硬化發(fā)生發(fā)展過程異性miRNA,如在血管內(nèi)皮的損傷方面我們發(fā)現(xiàn)有miR-126,miR-15b,miR-16,miR-20a,miR-20b特異性表達;在血管平滑肌遷移增值方面我們發(fā)現(xiàn)有miR-21,miR-221/222,miR-143,miR-145。而在單核/巨噬細胞吞噬脂質(zhì)成為泡沫細胞方面我們發(fā)現(xiàn)有miRNA-146a。
3討論
動脈粥樣硬化是當前心血管學科研究較多的一個專業(yè)方向,對于早期診斷、早期干預冠心病的發(fā)生有極其重要的意義。目前,被大部分專家和學者接受的有內(nèi)皮細胞損傷學說、平滑肌細胞遷移增殖學說、單核細胞源性泡沫細胞形成細胞學說等。多年來的研究發(fā)現(xiàn),多種基因或蛋白的表達上調(diào)或下降對本病的發(fā)生、發(fā)展起到了較為重要的作用。并根據(jù)基因或蛋白與本病的聯(lián)系性分為密切相關、候選以及致病基因。我們對在這幾個學說中的關鍵基因的相關特異性miRNA進行了預測[4]。以期望對于動脈粥樣硬化這一心腦血管疾病的基礎病變能夠做到早檢測早治療。
血管的內(nèi)皮細胞是具有維持血管的完整和穩(wěn)定的作用,覆蓋于血管腔[4]。miRNA的內(nèi)皮細胞特異性表達為miR-126,其可在人臍靜脈的內(nèi)皮細胞中發(fā)揮對腫瘤壞死因子α誘導內(nèi)皮分子的表達的抑制作用,來將內(nèi)皮細胞的炎癥反應進行減輕,甚至還可以對動脈粥樣硬化斑塊的穩(wěn)定性起到調(diào)節(jié)的作用。在研究中發(fā)現(xiàn)miRNA-663,其可以通過對炎癥因子的表達來誘導炎癥反應。目前已知的誘導血管發(fā)生的生長因子中,最強的就是血管內(nèi)皮生長因子,miR-15b,miR-16,miR-20a和miR-20b均對血管內(nèi)皮生長因子可有靶向調(diào)節(jié)作用,通過增加血管內(nèi)皮因子生長的表達,來促進血管發(fā)生。因此miRNA對血管內(nèi)皮細胞的調(diào)節(jié)可影響動脈粥樣斑塊的發(fā)生以及發(fā)展。
在動脈硬化的進展中,血管平滑肌細胞起到了遷移以及增殖的作用,是血管發(fā)生狹窄并且使動脈粥樣硬化發(fā)生的根本原因。miR-21[5]已經(jīng)被證實對血管平滑肌細胞的增殖和凋亡具有非常重要的調(diào)節(jié)作用,miR-221/222在研究中發(fā)現(xiàn)能夠促進血管平滑肌細胞的增殖。通過對小鼠的研究,如果上調(diào)miR-221/222則可使其增殖,相反抑制則會使血管平滑肌細胞增殖減少。而miR-143與miR-145在血管受到損害時,可以對血管平滑肌細胞的分化型進行加速,對其去分化型起到抑制作用,平衡了細胞的增殖與凋亡,可以很好地阻止血管發(fā)生病理變化。如能通過調(diào)控miRNA對血管平滑肌細胞的調(diào)節(jié)作用,將是非常好的治療動脈粥樣硬化的技術。
在動脈粥樣硬化發(fā)生和發(fā)展的過程中,單核/巨噬細胞可以促進炎癥以及斑塊的破裂。斑塊的穩(wěn)定性主要的因素是巨噬細胞的數(shù)量和纖維冒厚度還有新生血管的多與少。研究發(fā)現(xiàn)miRNA對單核細胞具有調(diào)節(jié)功能,主要是對巨噬細胞的成熟、炎細胞因子和膽固醇的代謝,通過影響以上因素來影響動脈粥樣硬化的發(fā)生發(fā)展。單核細胞在遷移到血管內(nèi)皮時分化為巨噬細胞,并且分泌出炎癥因子,為動脈粥樣硬化炎癥的形成提供了重要的環(huán)境。研究發(fā)現(xiàn)miRNA-146a能夠調(diào)節(jié)能夠影響脂質(zhì)的攝入和炎癥因子的分泌,使用miRNA抑制劑能夠減少炎癥因子[6]。
目前生物信息學的資源非常豐富,在心血管疾病的研究方面也在不斷提高,miRNA的研究在心血管疾病方面是熱點。預測miRNA是最近幾年才出現(xiàn)的生物信息學應用,相對于驗證microRNA基因而言,驗證靶基因的過程更難,更具有挑戰(zhàn)性,注定會有很長的路要走。未來我們對于miRNA及其靶基因的認識將大大地依賴于開發(fā)有效的預測方法。而實驗數(shù)據(jù)的積累也將帶動預測方法的不斷改進miRNA及其靶基因的功能研究將成為計算科學與實驗科學成功結(jié)合的良好示例。雖然目前仍舊處于實驗室研究階段,對于其在臨床上的應用,還需要走更長的路接受更多的挑戰(zhàn),但通過對miRNA在心血管疾病中的特異性表達的鑒別,miRNA在動脈粥樣硬化中起的調(diào)節(jié)作用不久必會得到了實驗的研究證實,所以通過調(diào)節(jié)miRNA來進行動脈粥樣硬化的治療,并且提供更好的預防,來實現(xiàn)真正的治療心血管疾病為患者帶來福音將不再遙遠。
參考文獻
[1]呂德康,葛瑛,柏錫,等.生物信息學在植物miRNA 研究中的應用[J].生物信息學,2009,07(02):113-116.
[2]龍萬平,何延政.miRNA在動脈粥樣硬化病變中作用研究進展[J].瀘州醫(yī)學院學報,2012,35(03):340-342.
[3]崔慶華.代謝性心血管病變-生物信息學的應用[J].生理科學進展,2012,43(05):361-365.
[4]宋翠珠,郭韌,張畢奎.MicroRNA 對動脈粥樣硬化發(fā)生的調(diào)控作用及其臨床應用[J].中國生物化學與分子生物學報,2013,29(01):13-18.
篇2
1.大數(shù)據(jù)時代下大學生教育信息一體化現(xiàn)狀
如今,我們生活在一個信息與網(wǎng)絡的時代,在這一時代之下,人們的生活也已經(jīng)發(fā)生了翻天覆地的變化。人們的生活與學習都通過信息網(wǎng)絡以數(shù)據(jù)的形式記錄下來,伴隨著保存的數(shù)據(jù)越來越多,我們實際上正在逐漸地步入一個充滿大數(shù)據(jù)的時代。有資料將大數(shù)據(jù)定義為:涉及的、巨大的、沒有辦法通過人工在所規(guī)定的時間之內(nèi)完成截取、管理以及整理成為人類所能解讀的信息,以幫助人類能夠進行正確的決策目的[1]。
與此同時,大數(shù)據(jù)也具有以下幾方面的特征:數(shù)據(jù)量大、數(shù)據(jù)形式多樣化、數(shù)據(jù)流動的速度較快以及數(shù)據(jù)價值密度比較低等。這四大特征的存在,決定了大數(shù)據(jù)時代的發(fā)展,能夠為人類的生活帶來了更多的便利,使得人們的生活形式與學習形式更加的豐富多彩。
我國信息素養(yǎng)教育已開展了二十幾年,但主要是以文獻檢索課方式進行,目前信息素養(yǎng)教育存在諸多問題,根據(jù)《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年》對高素質(zhì)專門人才和拔尖創(chuàng)新型人才培養(yǎng)的新要求,構建良好的信息素養(yǎng)一體化教育體系是適應這一要求的重要舉措。探討如何將信息素養(yǎng)教育貫穿于大學教育的全過程和構建全方位、一體化的信息素養(yǎng)教育體系,以實現(xiàn)大學生信息素養(yǎng)的整體提升,是十分必要和重要的。
“十二五”以來,為了全面實施素質(zhì)教育,我國高校在信息素養(yǎng)教育的研究與實踐方面取得了較為顯著的成效。但與國外一些發(fā)達國家相比,在信息素養(yǎng)教育一體化教育模式等方面存在差距。據(jù)筆者調(diào)2012年調(diào)查發(fā)現(xiàn),目前大學生的信息素養(yǎng)并不高,信息意識不強,信息道德匱乏,如不尊重知識產(chǎn)權、學術規(guī)范等,究其原因,主要是高校對信息素養(yǎng)教育重視程度還不夠,沒有形成全方位、多層次的一體化教育模式。
2.基于創(chuàng)新視角下的分析新型綜合網(wǎng)絡平臺的必要性
時代在發(fā)展,亟需創(chuàng)新型綜合人才。本科生是創(chuàng)新能力的生力軍,創(chuàng)新思維和創(chuàng)新能力的培養(yǎng)從大學生抓起,夯實基礎,才能枝繁葉茂,生生不息。多種模式下的新型綜合網(wǎng)絡平臺集教育、管理、服務一體化從多個方面多個視角打造校園網(wǎng)絡服務平臺建設,更加有利于大學生創(chuàng)新素質(zhì)的培養(yǎng)和發(fā)展。
21 世紀是一個以知識經(jīng)濟為主導的信息時代,而知識經(jīng)濟則是以創(chuàng)新的速度、方向決定成敗的經(jīng)濟。在這樣的時代里, 只有創(chuàng)造性人才才能掌握主動權, 也只有創(chuàng)造力開發(fā)才是人類通向 21 世紀的保證。因此,作為21 世紀人才培養(yǎng)基地,高等學校,必須要引導學生學會自主學習,引導學生學會創(chuàng)新理念。如何引導?首先,必須要走出計劃經(jīng)濟條件下傳統(tǒng)教育的誤區(qū), 必須要從以知識灌輸為中心的應試教育轉(zhuǎn)變?yōu)閯?chuàng)造教育為中心的素質(zhì)教育,這有賴于建立一體化的信息化平臺。再次,是自主教育,創(chuàng)設問題情景與民主寬松的心理氛圍, 培養(yǎng)學生的創(chuàng)造精神, 訓練學生的創(chuàng)造性思維, 培養(yǎng)學生善于發(fā)現(xiàn)問題、分析問題與解決問題的能力, 從而挖掘?qū)W生的創(chuàng)造潛能,也許信息一體化平臺的支持。
在新時期新條件下, 我國高等教育吸取了歷史的經(jīng)驗教訓, 提出了以創(chuàng)新精神為核心的素質(zhì)教育, 這是一個偉大的、歷史的轉(zhuǎn)折, 是適應 21 世紀新時代對人才素質(zhì)要求的根本標志[2]。因此, 如何營造一個有利于大學生自主學習的創(chuàng)新教育、管理、服務平臺, 已成為高等院校迫在眉睫的任務。也正是因為如此, 當今高校學生校園網(wǎng)絡平臺才會像雨后春筍般脫穎而出。面對這種形勢和情況, 高校教育者們必須以全新的態(tài)度, 重新認識校園網(wǎng)絡平臺的重要作用, 使其對大學生的綜合素質(zhì)培養(yǎng)發(fā)揮其積極的作用,實現(xiàn)培養(yǎng)創(chuàng)新應用技能型人才的教育目標。
3.新型一體化綜合網(wǎng)絡平臺的整合與協(xié)同
3.1 一體化的總體思路
所謂一體化總體思路,是在綜合考慮學校教育、管理、服務信息化建設的現(xiàn)狀與需求的基礎上,從全局和整體的高度規(guī)劃學校信息化建設的方針、策略、發(fā)展規(guī)劃與實施計劃,全面考慮硬件環(huán)境建設、應用系統(tǒng)建設、管理規(guī)范建設和支持機制建設,按照規(guī)劃協(xié)同地推進學校信息化。而要搞好高校創(chuàng)新教育、管理、服務信息化的一體化建設,關鍵是要抓住科學全面的總體規(guī)劃和協(xié)同有序的項目實施兩個環(huán)節(jié)。
3.2 科學全面的總體規(guī)劃
做好總體規(guī)劃是搞好高校信息化的關鍵,總體規(guī)劃的制定不是一件簡單的事情,它需要在充分了解學校的信息化現(xiàn)狀、需求,特別是學校發(fā)展對于信息化的需求的基礎上,結(jié)合IT技術的發(fā)展形勢做出科學、全面的規(guī)劃。
3.3 協(xié)同有序的項目實施
總體規(guī)劃做好后,信息化建設成功的關鍵就在于項目的組織實施。項目的實施有很多需要考慮的問題,如項目組織者的選擇、軟硬件的選型、實施隊伍的選擇、實施進度安排等等,但是,從宏觀組織管理來說,有兩個方面一定要特別注意,一是協(xié)同,二是有序。
在信息化建設中,硬件環(huán)境(包括網(wǎng)絡與服務器系統(tǒng))和軟件系統(tǒng)需要協(xié)同建設,硬件環(huán)境的建設可以適度超前,但不必過于豪華,否則會導致資金的嚴重浪費;軟件系統(tǒng)的建設與應用要及時跟進,這樣才能充分發(fā)揮信息化的作用。
篇3
關鍵詞:生物信息學 教材 分析
中圖分類號:G4233文獻標識碼:A文章編號:1009-5349(2017)06-0019-02
近些年,生物信息學順應時代變化而成為生命科學的新興領域。[1]生物信息學主要是對核酸和蛋白質(zhì)兩個大方向的數(shù)據(jù)進行處理與分析。[2]目前,生物信息學作為基礎課程在各高校生物科學專業(yè)及相關專業(yè)開設。其教學質(zhì)量的高低對于培養(yǎng)學生的綜合能力具有重要的意義。[3]因此,各高校在教材選擇、課程安排、教學內(nèi)容、實踐教學等方面不斷進行改進。[4]優(yōu)秀的生物信息學教材是提高教學質(zhì)量的基礎。對不同的教材進行對比分析,從中選取適合相關專業(yè)的教材,是教師的必要工作。本文對五種生物信息學教材進行分析,為不同專業(yè)對于教材的選擇提供參考和建議。
一、研究方法及教材簡介
(一)文獻研究法
筆者主要從以下三個方面進行文獻檢索。首先,搜索與生物信息學教材分析相關的著作。其次,利用中國知網(wǎng)、萬方數(shù)據(jù)庫等檢索與教材分析相關的期刊論文。最后,借鑒優(yōu)秀教師的教案,仔細閱讀并進行分析。深入了解相關生物信息學教材分析的背景以便進行整理分析。
(二)對比研究法
本文主要選取了五種生物信息學教材,根據(jù)教材的基本框架結(jié)構及特點,對其進行對比分析,分析總結(jié)不同教材之間異同。
二、生物信息學教材分析
隨著課程改革的不斷完善,針對不同地區(qū)、不同專業(yè),教材的使用也趨向多元化。生物信息學教材是教師進行教學活動的基礎。對不同的生物信息學教材進行對比,以便教師作出最適合的選擇。如表1所示,對五種教材從宏觀角度進行內(nèi)容上的分析。
如表1所示,從中可看出這五種教材從整體編寫方面,都涵蓋了核酸和蛋白質(zhì)兩個主要層面。主要內(nèi)容包括:生物信息學的概念及發(fā)展歷程、數(shù)據(jù)庫的介紹、生物信息學常用統(tǒng)計方法、基因組學、蛋白質(zhì)組學等幾大方面。并且,大多數(shù)教材都附有思考題,有利于學生課后對知識進行運用及加深理解。只是隨著生物信息學的飛速發(fā)展,不同版本的教材增添了新的相關的知識。同時不同教材的側(cè)重點略有差異。
另一方面,從表1中可看出,五種教材所包含的章節(jié)為7到15章不等。這說明,隨著科學技術的不斷發(fā)展,更多的前沿知識不斷地填充到教材中。所以,隨著時間的變化,不同的教材,具有各自的特色。
首先,教材的側(cè)重點不同。隨著各物種的基因組計劃的不斷完成,生物信息學發(fā)展實現(xiàn)了質(zhì)的飛躍。并且融入到各個領域中。例如:由李霞、雷建波編寫的《生物信息學》,側(cè)重介紹了生物信息學與疾病的相關聯(lián)性。教材在內(nèi)容和形式上有所創(chuàng)新。突出實用性,以臨床實際問題作為編寫出發(fā)點;而劉娟編寫的《生物信息學》一書中,以豐富的實例,重點介紹了相關數(shù)據(jù)庫和軟件的功能、應用策略和使用方法。在章節(jié)編排上涉及微陣列數(shù)據(jù)分析的內(nèi)容,突出了生物信息學與數(shù)學的融合。
其次,不同教材的難度存在差異性。陶士珩編寫的《生物信息學》較基礎,包含了生物信息學基本內(nèi)容,力求使學生全面了解和掌握生物信息學領域的重要基礎知識與基本操作技能。而陳銘編寫的《生物信息學》,根據(jù)生物信息學多學科融合的特點,增添編程與統(tǒng)計學知識,教材所涉及的知識范圍廣泛。使得無論是對教師還是學生來講,都要求具有深厚的學科背景。
最后,學科之間聯(lián)系程度差異。生物信息學作為一項生物科學的工具,不僅僅應用于生物學,同時,在醫(yī)學、農(nóng)業(yè)專業(yè)、計算機科學等領域。[10]但不同教材所體現(xiàn)生物信息學與其他學科的聯(lián)系程度不盡相同。例如:吳祖建編寫的《生物信息學分析實踐》一書,主要包含了數(shù)據(jù)庫檢索、引物設計、序列分析等諸多技術問題。書中以圖表形式為主,文字介紹為輔,以讓學生學會操作為主,將生物信息學與計算機科學緊密結(jié)合。
三、結(jié)語
生物信息學重要特點為學科交叉性,涉獵范圍廣。不同的生物信息學教材適用于不同專業(yè)。本文對五種教材進行對比分析,根據(jù)教材不同特色并結(jié)合不同專業(yè)特點,為教師選擇適合的教材提出建議。陶士珩、劉娟編寫的兩版不同《生物信息學》,內(nèi)容基礎,適用農(nóng)業(yè)專業(yè)和師范專業(yè)作為教學用書;李霞、雷健波編寫的教材,主要突出了與醫(yī)學相關聯(lián)系,適用于醫(yī)學專業(yè)用書;陳銘、吳祖建所編寫教材,注重與計算機科學的關聯(lián),實踐性強,有利于培養(yǎng)學生動手操作能力,適用于計算機專業(yè)。
參考文獻:
[1]朱杰.生物信息學的研究現(xiàn)狀及其發(fā)展問題的探討[J].生物信息學,2005,3(4):185-188.
[2]趙屹,谷瑞升,杜生明.生物信息學研究現(xiàn)狀及發(fā)展趨勢[J].醫(yī)學信息學雜志,2010(5):2-6.
[3]倪青山,金曉琳,胡福泉等.生物信息學教學中學生創(chuàng)新能力培養(yǎng)探討[J].基礎醫(yī)學教育,2012,14(11):816-818.
[4]向太和.我國現(xiàn)有《生物信息學》教材和網(wǎng)絡資源的分析[J].杭州師范學院學報(自然科學版),2006,5(6).
[5]陶士珩.生物信息學[M].北京:科學出版社,2007.
[6]劉娟.生物信息學[M].北京:高等教育出版社,2014.
[7]吳祖建.生物信息學分析實踐[M].北京:科學出版社,2010.
[8]陳銘.生物信息學(第二版)[M].北京:科學出版社,2015.
[9]李霞,雷建波.生物信息學(第二版)[M].北京:人民衛(wèi)生出版社,2015.
[10]高亞梅,韓毅強.《生物信息學》本科教學初探[J].生物信息學,2007,5(1):46-48.
篇4
關鍵詞:中醫(yī)大數(shù)據(jù);生物信息學;高校教學
中圖分類號:G642 文獻標識碼:A 文章編號:1009-3044(2016)27-0123-03
Abstract: Analyzed the developing status of Bioinformatics combined with Chinese Medicine, proposed the education directions for the combinations of Chinese Medicine and Bioinformatics, discussed the using of Bioinformatics techniques in Chinese Medicine big data with teaching and researching area by three common method in Bioinformatics.
Key words: chinese medicine big data; bioinformatics; education in university
1 引言
生物信息學是一門新興學科,在各大高等院校醫(yī)學或生物學相關專業(yè)都有與之相關的課程或?qū)I(yè)開設。與我們常見的物理、數(shù)學、法學等學科不同,生物信息學更像是一個學科領域,它不僅僅局限于某個科學研究,而是綜合運用數(shù)學、計算機學和生物學的各種工具及方法來分析和理解在大數(shù)據(jù)背景下的生物學意義[1]。經(jīng)過20余年的發(fā)展,生物信息學已在分子進化、基因測序、遺傳及變異研究等領域取得了突破和成果,是21世紀人類三大計劃之一“人類基因組計劃(Human Gene Project HGP)”的核心支撐學科。在美國,早于1988年便成立國家生物技術信息中心(NCBI),隨后歐洲和日本在1993年和1995年分別建立了歐洲生物信息學研究所(EBI)和信息生物學中心(CIB)用來對數(shù)以萬計的核酸及蛋白質(zhì)等數(shù)據(jù)進行維護并發(fā)展至今日趨成熟[2]。生物信息學于上世紀90年代初開始逐漸引起國內(nèi)科學工作者的重視,經(jīng)過20多年的發(fā)展也已初具規(guī)模。筆者通過對近20年公開發(fā)表的有關生物信息學關鍵字的文章進行搜索,運用Excel制圖繪制了自1996年至今每年發(fā)表文章數(shù)量的散點圖。從圖1可以發(fā)現(xiàn),關于生物信息學學科的研究數(shù)量在2014年達到頂峰,并逐漸開始下滑。同時,由于搜索結(jié)果包含雜質(zhì)數(shù)據(jù)(如被動截取“信息學”為關鍵詞),為了使圖表信息量有度可量,筆者繼續(xù)對在認知上與生物信息學相關的科學領域進行關鍵詞搜索,分別為“數(shù)據(jù)挖掘”和“人工智能”,并繪制圖2。由該圖可直觀地看出,人工智能的研究一直穩(wěn)步發(fā)展,符合21世紀科技高度發(fā)展的大趨勢,而數(shù)據(jù)挖掘技術的相關研究自2005年以來迅猛增長并趕超人工智能。綜合分析其主要原因是由于中國人口眾多,自2005年以來互聯(lián)網(wǎng)用戶不斷增加,全民聯(lián)網(wǎng)的時代逐漸構成,互聯(lián)網(wǎng)信息產(chǎn)業(yè)的急劇擴大以及電子商務、云技術等網(wǎng)絡相關產(chǎn)業(yè)的發(fā)展帶來的信息膨脹,使越來越多的人意識到大數(shù)據(jù)的作用和研究數(shù)據(jù)挖掘?qū)?jīng)濟發(fā)展、社會進步的重要影響,進而推動數(shù)據(jù)挖掘的學科發(fā)展。
2 中醫(yī)大數(shù)據(jù)背景下的生物信息學課程教學
從圖2的對比可以看出,生物信息學的研究數(shù)量與其他兩個學科對比,則顯得相形見絀。也就是說,生物信息學在我國的發(fā)展仍較為緩慢,使之與其對人類社會的貢獻度不成正比。進一步對圖1的搜索結(jié)果進行高級檢索,對已有的生物信息學研究進行劃分,將”中醫(yī)”關鍵詞加入其中,結(jié)果發(fā)現(xiàn)將中醫(yī)與生物信息學相結(jié)合進行研究的文獻少之又少,每年文獻不過20左右。生物信息學的作用就是利用計算機等技術對海量的生物數(shù)據(jù)進行分析并洞察隱藏在其中的規(guī)律,而中醫(yī)數(shù)據(jù)經(jīng)歷數(shù)代中醫(yī)名師的記錄和數(shù)十年來信息存儲技術的發(fā)展已經(jīng)儼然呈現(xiàn)出高緯度、高階度的大數(shù)據(jù)結(jié)構。因此,生物信息學在中醫(yī)數(shù)據(jù)的研究中一定具有其特殊的價值和意義,是從微觀層面描述中醫(yī)整體結(jié)構的重要手段。本文將以中醫(yī)證侯、病證和中醫(yī)復雜性為切入點,結(jié)合研究生物信息學在其中的應用價值,并討論在教育教學過程中如何使中醫(yī)和生物信息學有機結(jié)合,做到融會貫通。
2.1從“定性”和“定量”學習角度看基因組學學習中醫(yī)“證”本質(zhì)
在中醫(yī)學中,“證”是立方立法的基礎,醫(yī)者通過四診獲取的信息進行綜合分析和判斷,從病癥體征等表現(xiàn)集合入手,得出相應的證候,有針對性的用藥治療。中醫(yī)與西醫(yī)不同,講究以整體論看待人體以及病變,“辨證論治”思想也是千百年來各名中醫(yī)學者通過反復探索得出的實踐經(jīng)驗,對中醫(yī)遣方用藥具有決定性的指導意義。而西醫(yī)認為,疾病的發(fā)生與發(fā)展是與人體某段特異的基因的改變有關,HGP的研究目的也正是為了揭示人體的構成奧秘從而從本質(zhì)上研究疾病的產(chǎn)生和發(fā)展規(guī)律[3]。因此,中醫(yī)與西醫(yī)在指導醫(yī)者診療的哲學思想上是有很大不同,甚至可以說是截然相反的。然而中醫(yī)與西醫(yī)的內(nèi)在關聯(lián)卻無處不在,結(jié)合點之一正是基因與證候的關聯(lián)。對于基因組學和中醫(yī)證候的學習方法是不同的,一個是定量學習,另一個則是定性學習,定量學習有助于學生更加客觀的研究生物體的發(fā)展規(guī)律,并結(jié)合現(xiàn)代計算機技術做到多學科交叉學習與實驗,而不足之處在于缺乏主觀思考、學習方式較為分散缺乏整體思維把控;而定性學習則以某一指導思想為主線,通過對某些案例及知識長時間的觀察和分析,從中得出結(jié)論。定量學習如基因組學更重視量化計算及工具的使用,而定性學習如中醫(yī)證候則更重視理論與實踐結(jié)合,整體到局部學習。在學習的過程中,無論基因組學還是中醫(yī)證候,都會以疾病為具體的研究對象。從西醫(yī)上說,基因是決定人是否患病的內(nèi)部原因,通過遺傳或基因狀態(tài)的改變都可能導致疾病的產(chǎn)生,從中醫(yī)上說,證候是疾病狀態(tài)下的臨床類型,反映了機體在疾病發(fā)展過程中的病理特征[4]。因此,將證候與基因組學統(tǒng)一學習,實則是將定量與定性學習相結(jié)合以實際疾病案例和數(shù)據(jù)著手從而多方面運用計算機、西醫(yī)學、證候?qū)W、數(shù)學等學科知識對生物大數(shù)據(jù)進行分析的綜合學習方法。
2.2 基于蛋白質(zhì)組學學習中醫(yī)病證相關性
證侯是人體生命活動的一種表現(xiàn),而生命活動的主要執(zhí)行者是蛋白質(zhì),兩者之間必然會有隱秘且細致的聯(lián)系,我們也應以此為出發(fā)點,培養(yǎng)學生的發(fā)散學習方法,綜合學科進行學習。自HGP的完成宣告了后基因組時代的到來后,研究生命科學的重心也由基因組學向蛋白質(zhì)組學逐漸轉(zhuǎn)變,作為教育者也應跟上科學發(fā)展的潮流,把生物科學研究和相關教學模式從基因水平向蛋白質(zhì)水平轉(zhuǎn)變。與此同時,蛋白質(zhì)組學是從整體角度分析細胞內(nèi)的動態(tài)變化以及蛋白質(zhì)組成成分、表達水平等,它的研究方法學內(nèi)容與中醫(yī)的整體觀和辯證論治觀有著許多相同之處。蛋白質(zhì)組學在分子水平上的DNA修飾和基因調(diào)控反應生命體的整體狀態(tài)(即陰平陽秘),中醫(yī)理論強調(diào)從整體觀對疾病進行認知,認為疾病的發(fā)生是人體整體功能的失調(diào)所致(即陰陽失調(diào)),重點在于辯證論治[5]。在教育教學過程中,將基因或蛋白質(zhì)方面的研究從結(jié)構研究向功能研究轉(zhuǎn)變,使研究更具體,透過相關功能性測試實驗,發(fā)現(xiàn)基因之間的相互聯(lián)系及相互作用,在定量學習的過程中培養(yǎng)學生的定性思維,使學生善于發(fā)現(xiàn)問題及對象之間的關聯(lián)。正如數(shù)據(jù)庫實體關系模型中的E-R圖一樣,在進行蛋白質(zhì)組學和中醫(yī)病癥相關性研究教育的過程中,中醫(yī)病證和蛋白組學可以看做是兩個看似毫無關聯(lián)的實體,而通過“疾病”將兩者相連,透過此種關系可以衍射出兩個學科方面的深入學習。
2.3 運用復雜系統(tǒng)性方法學習中醫(yī)藥復雜系統(tǒng)
中醫(yī)藥的復雜性相比西醫(yī)有過之而無不及,原因主要在于相對于“結(jié)構決定功能”的西方醫(yī)學思想,中醫(yī)更側(cè)重于“關系決定功能”,在這種情況下,無論是辨證論治還是癥狀體征變化,有關中醫(yī)診斷和治療的信息都是已高度離散和非線性的方式存儲,使得中醫(yī)稱為典型的“復雜自組織系統(tǒng)”[6]。尤其在信息離散度和復雜度較高的中醫(yī)證侯系統(tǒng)中,癥狀變量與證侯信息混雜在一起,想辨別兩者的區(qū)別和聯(lián)系是非常困難的事情,單純的研究數(shù)據(jù)往往缺乏正確的方向,而單純的研究理論則往往枯燥乏味。因此,在教學過程中,可以將復雜系統(tǒng)方法學引入中醫(yī)系統(tǒng)學習,通過復雜系統(tǒng)中的熵分劃方法將證侯系統(tǒng)的離散變量加工轉(zhuǎn)化為線性關聯(lián)集合,即將癥狀變量通過關聯(lián)度集合成多個癥狀集合,并將癥狀集合與關聯(lián)度較高的證侯要素進行聯(lián)結(jié)。以此方法既可以激發(fā)學生對理論學習的興趣,又能以理論指導實踐,對中醫(yī)證侯大數(shù)據(jù)進行信息提取,達到全面學習。
3 結(jié)束語
中醫(yī)信息學已經(jīng)作為一門新興學科在我國各大高校開設,相關師生深入研究和學習,主要目的就是發(fā)掘蘊含在中醫(yī)幾千年發(fā)展結(jié)晶中的奧秘。關于中醫(yī)藥數(shù)據(jù)的數(shù)據(jù)挖掘技術和研究也在近年日益增長,這都表明人們已經(jīng)愈來愈關注國粹,關注健康,關注未來。這也表明與之相關的學習和研究對未來的人生發(fā)展和機遇都有著深遠的影響。然而,數(shù)據(jù)挖掘的技術并不完全適用于中醫(yī)藥復雜系統(tǒng)中的信息發(fā)掘,若單純地將兩者進行結(jié)合教學,學生可能缺少知識銜接,缺乏過渡。這時若將生物信息學引入二者其中并結(jié)合生物信息學相關智能科技手段和技術,則可以從宏觀和微觀兩個方面去看待生命體:宏觀上面對復雜的中醫(yī)系統(tǒng)不需感到困惑,而是以“復雜系統(tǒng)方法論去解決復雜系統(tǒng)”,使學生不要總想著從每一個局部都能分析到問題的本質(zhì),而是接受復雜性,從復雜系統(tǒng)的角度去解釋生命體的自組織現(xiàn)象,對生命體的宏觀表現(xiàn)進行研究;微觀即是在分子水平上去分析中醫(yī)證侯的本質(zhì),方劑的復雜體系,去了解生命體內(nèi)部的調(diào)控機制等,以此加深學生對中醫(yī)理論的理解以及對生物信息學工具和技術運用的融會貫通。
參考文獻:
[1] 鐘濤.基于復雜系統(tǒng)方法的慢性胃炎中醫(yī)問診證侯建模研究[D].上海:華東理工大學,2014.
[2] 譚從娥,王米渠,馮文哲等. 生物信息學分析寒癥海量數(shù)據(jù)的探索[J].中華中醫(yī)藥學刊,2008,26(12):2569-2570.
[3] 李方玲,梁嶸.對中醫(yī)證侯規(guī)范化研究的探討[J].遼寧中醫(yī)雜志,2006,33(4):386-387.
[4] 西廣成.復雜系統(tǒng)方法學與中醫(yī)證侯建模[M].北京:科學出版社,2010:91-95
篇5
【關鍵詞】數(shù)學建模生物信息學教學
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2014)05-0214-01
1. 引言
生物信息學是融合生命科學與數(shù)理科學的一門新興學科[1]。1995年在人類基因組計劃第一個五年總結(jié)報告中對生物信息學的定義是: “它是一門研究包括生物信息的獲取、處理、存儲、分發(fā)、分析和解釋等在內(nèi)的所有方面,并綜合運用數(shù)學、計算機科學和生物學的各種工具,來闡明和理解大量數(shù)據(jù)所蘊含的生物學意義的新興的交叉學科?!彪S著人類基因組計劃的完成,生物信息學的研究進入了后基因組時代,它已廣泛的滲透到生物、醫(yī)藥、農(nóng)業(yè)、環(huán)境等各個相關研究領域中,成為生命科學和自然科學的重大前沿領域之一。目前,國內(nèi)很多高等院校已經(jīng)開設了生物信息學本科專業(yè)。
數(shù)學建模是一門綜合多門學科知識,集應用與能力培養(yǎng)為一體,有利于培養(yǎng)學生的創(chuàng)造意識和應用實踐能力的學科[2]。生物信息學專業(yè)的本科生在學習完基本的數(shù)理知識以及生物信息學專業(yè)基礎課后,通過數(shù)學建模課程的學習,能夠使學生綜合運用所學的知識解決實際問題,實現(xiàn)了從理論學習到實踐應用的跨越;使學生深刻體會到理論指導實踐,實踐進一步檢驗和完善理論的過程。本文對數(shù)學建模在醫(yī)學院校生物信息學專業(yè)的開展及具體的教學進行了實踐探索,目的是培養(yǎng)學生的建模思維和創(chuàng)新能力,為學生綜合運用所學知識解決實際問題以及今后的科研打下良好的基礎。
2. 教學實踐與探索
在醫(yī)學院校生物信息學專業(yè)的數(shù)學建模教學中,我們旨在通過體現(xiàn)學科特點的模型的學習以及實踐活動培養(yǎng)學生的建模思維、實際動手能力與創(chuàng)新能力。
2.1 精選模型,體現(xiàn)學科特點
在數(shù)學建模的教學中,我們主要通過學習已有的數(shù)學模型來完成整個課程的學習,包括問題的分析、模型的假設、模型的建立、模型的求解與分析以及后續(xù)的模型檢驗與應用等。因此如何選擇適當?shù)哪P统蔀榻虒W中的首要問題。
在選擇數(shù)學模型時,除了注重模型需具有簡潔性和趣味性[3]以外,我們特別選擇了能夠體現(xiàn)醫(yī)學院校生物信息學專業(yè)特點的模型,與學生所學的專業(yè)緊密結(jié)合。如DNA序列分類模型、人類癌癥基因預測模型、人類疾病網(wǎng)絡模型等。此外,在選擇這些模型時注意建立的模型具有階梯性,即由淺入深,由簡到繁,以符合學生的邏輯思維。對于給定的實際問題,我們首先想到的是最簡單的模型,然后分析模型的局限性及產(chǎn)生的原因,進而尋找策略改進模型,如此形成一種階梯式的建模過程,最終使得建立的模型越來越接近實際問題,達到完善的地步。例如,對于DNA序列分類模型(2000年全國大學生數(shù)學建模競賽試題),我們可以先后構建特征密碼子概率分布判別模型、圖論最小生成樹模型以及向量空間直觀判別模型,這三個模型體現(xiàn)了模型逐步升級的過程。
2.2 逐步引導,培養(yǎng)學生建模思維
數(shù)學建模需要綜合運用多學科知識,這對于剛剛接觸建模的學生來說是比較困難的,需要逐步引導他們,培養(yǎng)建模思維。我們主要借助于具有階梯性的數(shù)學模型、多媒體教學,通過講解和討論穿插的教學模式來引導學生。
仍以DNA序列分類模型為例,對于給定的已知類別的序列和待分類的人工序列(序列較短)及自然序列(序列較長),首先想到的是從已知類別中提取特征,用特征對未知序列進行分類。通過討論,大部分學生很自然的想到選取序列中ATGC四個堿基的含量作為特征,但是這個特征很粗,結(jié)果發(fā)現(xiàn)很多序列用這個特征無法分類。接下來學生想到用密碼子,對64個密碼子進行分析提取特征,結(jié)果顯示此種特征對人工序列得到較好的分類效果,但不適用于自然序列。隨后基于上面的結(jié)果,進一步應用圖論中的最小生成樹模型解決問題,發(fā)現(xiàn)分類效果較好。此外,在討論中,有學生也提到了應用“與已知類別特征相近的物質(zhì)歸到一類”的思想,運用二維向量夾角余弦進行分類,結(jié)果表明分類效果優(yōu)于前兩種方法。在學習模型的過程中,我們邊講解邊引導學生思考問題,討論問題,并結(jié)合多媒體演示,環(huán)環(huán)相扣,這樣的學習方式往往引人入勝,充分調(diào)動了學生學習的積極性,培養(yǎng)了學生的建模思維。
2.3 教研結(jié)合,培養(yǎng)學生動手能力與創(chuàng)新能力
理論用于指導實踐,沒有實踐的理論是空洞的。在學習完別人建立的模型之后,我們要求學生自己動手解決實際問題,建立模型,正所謂的“依葫蘆畫瓢”。我們本著寓研于教,教研結(jié)合的思想,將科研中遇到的一些實際問題融入教學中,充分發(fā)揮學生的想象力與創(chuàng)造力。我們精選具有生物信息學專業(yè)特點、體現(xiàn)學科前沿的兩個實際問題作為建模試題,讓學生三人一組以論文形式完成。如我們選取了給藥方案(較簡單)和人類癌癥miRNA預測(較復雜)兩個實際問題作為建模試題。較簡單的問題讓學生利用實驗課的時間進行完成,較復雜的問題以作業(yè)形式讓學生利用課余時間完成,并將兩次建模的成績作為學生本門課程的最后成績。
這種考核方式不僅培養(yǎng)了學生動手能力與創(chuàng)新能力,而且讓他們體會到之前所學習的專業(yè)基礎課的意義所在。此外,學生們對科研問題創(chuàng)造性的思維往往超乎我們的想象,為我們生物信息專業(yè)的發(fā)展注入新的力量,也為學生后續(xù)從事相關領域的研究工作打下堅實的基礎。
3. 小結(jié)
筆者根據(jù)自己在醫(yī)學院校生物信息學專業(yè)數(shù)學建模課程的教學實踐,提出了幾點可行性的措施。本著寓研于教,教研結(jié)合的思想,通過精選體現(xiàn)學科特點的模型,采取講解和討論穿插的教學模式逐步培養(yǎng)學生的建模思維,利用建模試題培養(yǎng)學生實際動手能力與創(chuàng)新能力,取得了較好的教學效果。隨著生物信息學以及相關學科的不斷發(fā)展,生物信息專業(yè)的數(shù)學建模課程將更加富有挑戰(zhàn)性,我們將根據(jù)科學發(fā)展以及學生的反饋意見不斷修訂教學內(nèi)容,豐富教學方法,提高生物信息學專業(yè)數(shù)學建模課程的教學質(zhì)量,真正培養(yǎng)學生分析問題、解決問題的能力。
參考文獻:
[1]李霞,李亦學,廖飛.生物信息學[M],北京:人民衛(wèi)生出版社,2010.
篇6
[關鍵詞]生物信息學 課程教學改革 創(chuàng)新能力培養(yǎng)
[中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2013)16-0061-02
當前生物信息學的研究主要集中于核苷酸和氨基酸序列的存儲、分類、檢索和分析等方面,所以目前生物信息學可以狹義地理解為“將計算機科學和數(shù)學應用于生物大分子信息的獲取、加工、存儲、分類、檢索與分析,以達到理解這些生物大分子信息的生物學意義的交叉學科”。生物信息學的發(fā)展,對人們分子水平上認識生命活動的規(guī)律起著關鍵性的作用。生物信息學是一門理論性和實踐性都很強的課程,理論與實踐的結(jié)合十分緊密。生物信息學課程的授課內(nèi)容分為理論基礎和上機操作部分,主要特點是傳授理論知識和培養(yǎng)實踐能力并舉。在生物信息學的課堂教學中,既要強調(diào)基本理論、基本知識的傳授,同時也要加強學生的實踐能力和創(chuàng)新能力的培養(yǎng),以實際應用為主要側(cè)重點,著重培養(yǎng)學生的創(chuàng)新能力。根據(jù)生物信息學的課程特點,我們在理論教學、上機實踐操作及考試方式等方面進行了改革和探索,獲得了較好的教學效果。
一、激發(fā)學習興趣
生物信息學課程涉及的新技術較多,接觸的因特網(wǎng)也多為英文頁面,多數(shù)學生因而存在畏難情緒。對于分子生物學基礎及英文較差的學生,我們采用循序漸進的方式,鼓勵他們由淺入深地學習生物信息學的分析方法,由少到多地瀏覽英文網(wǎng)站,理解并掌握常用的生物信息學英文詞匯,從而增強了學習生物信息學的興趣和信心。學生通過對英文網(wǎng)站的不斷瀏覽,英文閱讀能力得到了很大提高;同時也開闊了視野,拓寬了知識面。隨著學生生物信息學分析能力及專業(yè)英語水平的提高,教師在理論課講解過程中,由少到多地逐步加大了英文教學的比例??傊ㄟ^激發(fā)學生的學習興趣,幫助學生逐步建立起學習的興趣和自信心,為學好生物信息學這門課程打下了堅實的基礎。
二、重視雙基訓練
本課程首先結(jié)合人類基因組計劃介紹生物信息學的歷史發(fā)展和概況,然后順序介紹生物數(shù)據(jù)庫分類、序列相似性比較、數(shù)據(jù)庫搜索、分子系統(tǒng)發(fā)育樹分析、基因組學與基因預測、蛋白質(zhì)結(jié)構預測等基本知識,以介紹基本理論和基本知識為主,啟發(fā)學生拓寬知識面,了解學科前沿和最新進展,培養(yǎng)學生解決生物信息學分析實際問題的能力,從而為今后進行生命科學研究奠定基礎。
生物信息學涉及的算法多數(shù)都較為枯燥,在授課過程中側(cè)重于分析方法的講解和應用。如在講授雙序列比對動態(tài)規(guī)劃算法Needleman-Wunsch全局比對和Smith-Waterman局部比對及分子系統(tǒng)發(fā)育樹構建UPGMA(Unweighted pair group method with arithmetic mean,非加權算術平均組隊法)等算法時,在多媒體教學的基礎上,結(jié)合板書演算實例、互動式“提問”等方法幫助學生理解算法的基本原理及分析方法;同時布置課后計算題作業(yè),要求學生獨立完成后上交,并作為平時成績考核的主要依據(jù)之一,從而促進學生鞏固基本理論和基本知識。
三、雙語多媒體教學
為了適應生物信息學知識全球化的特點,使學生能夠更好地接受最新的生物信息學知識,我們制訂了生物信息學課程雙語教學計劃,并在教學過程中分階段逐步實施。在第一階段,以漢語講授為主,英語滲透,中文教材為主,相關英文文獻為輔;在此基礎上,逐步向第二階段過渡,即漢英整合,不分主次,PPT課件和Flas采用英文版本;最終的目標是第3階段,即選用英文教材,制作英文版本的PPT教學課件,采用全英文授課方式。整個過程循序漸進,逐步淘汰傳統(tǒng)的中文教學。
在講解數(shù)據(jù)庫查詢和BLAST(Basic local alignment search tools)分析、Bankit在線序列提交和Sequin離線序列提交及DNASTAR、DNAMAN、MEGA等軟件包使用方法時,改變以往靜態(tài)演示的舊有模式,應用屏幕錄像專家軟件制作多媒體動畫文件,將操作步驟和鼠標的移動軌跡、點擊抓取下來,以便讓學生直觀地觀看課件。通過現(xiàn)場操作核酸序列的查詢、蛋白質(zhì)三維空間結(jié)構的顯示、限制性酶切圖譜繪制、PCR引物設計、序列組裝重疊群(contig)構建、分子系統(tǒng)進化樹構建等分析,應用多媒體設備將整個操作過程動態(tài)地逐一展示,直至最終完成整個過程,使學生得到了直觀體驗,加深了印象,從而更加容易掌握這些實踐操作。
四、加強上機操作
實踐教學相對于理論教學具有直觀性、驗證性、綜合性、啟發(fā)性和創(chuàng)新性的特點。為了提高學生的實踐操作能力,我們安排了多個驗證性、設計性上機實踐操作?!禢CBI數(shù)據(jù)庫的檢索與使用》讓學生熟悉GenBank核酸序列的格式、主要字段的含義、序列下載的方法,并掌握Entrez檢索工具的使用方法;《BLAST數(shù)據(jù)庫搜索》讓學生掌握BLAST數(shù)據(jù)庫搜索的分析方法;《核酸和蛋白質(zhì)序列的進化分析》讓學生掌握MEGA(Molecular evolutionary genetic analysis)和Clastalx等軟件構建分子系統(tǒng)進化樹的方法和步驟;《DNAMAN軟件的使用》讓學生掌握DNA序列的限制性酶切位點分析及PCR引物設計等基本操作方法;最后一次實踐上機課安排《核酸、蛋白序列的綜合分析》設計性實驗,讓同學們隨機組成兩人一組的研究小組,自選感興趣的基因并從GenBank數(shù)據(jù)庫中下載該基因的20條核酸序列及蛋白序列,分析其中1條核酸序列的堿基組成比例,反向互補序列、編碼的RNA序列及蛋白序列,分析其中1條蛋白序列的氨基酸組成比例、分子量、疏水性、等電點、亞細胞定位等物理、化學特性;同時基于DNA序列和蛋白質(zhì)序列構建分子系統(tǒng)發(fā)育樹。
五、網(wǎng)絡教學資源
生物信息學對于網(wǎng)絡工具高度依賴,由于受學時限制,課堂教學的內(nèi)容非常有限。為了給學生創(chuàng)造一個良好的自學環(huán)境,我們應用屏幕錄像軟件開發(fā)了上機實踐操作演示等教學資源;提供了課件供學生在網(wǎng)絡上下載使用,該課件覆蓋了生物信息學課程的全部教學內(nèi)容,包括相關的動畫演示等信息;另外還提供了DNASTAR、DNAMAN、MEGA、BIOEDIT等軟件安裝程序及使用手冊,相關英文參考文獻等,從而有效地擴大了學生的自學空間。
六、科研教學相長
本課程由具有生物信息學或分子生物學博士學位的教師承擔,每位授課教師的科研課題均涉及生物信息學分析。在生物信息學的教學過程中,授課教師積極融合個人的科研工作經(jīng)驗和成果,豐富了教學內(nèi)容。如在講授Bankit在線序列提交及Sequin離線提交序列時,我們以提交至國際核酸序列數(shù)據(jù)庫GenBank的芒草(Miscanthus sinensis)肉桂醇脫氫酶(JQ598683)、過氧化氫酶(JQ598684)、咖啡酰輔酶A-O-甲基轉(zhuǎn)移酶(JQ598685)、肉桂酸-4-羥化酶(JQ598686)為例;在講授基因外顯子和內(nèi)含子結(jié)構預測時,以牡丹(Paeonia suffruticosa)ACC氧化酶(FJ855434)和ACC合成酶(FJ769773)為例。通過把科研思路帶入教學中,有效培養(yǎng)了學生的科研能力及創(chuàng)新能力。此外,教學實踐也有利于教師全面了解生物信息學和相關學科的最新進展,不斷為科研提供新思路。
七、考試方式改革
生物信息學課程的目的是提高學生利用信息技術解決生物學問題的能力,因此主要考查學生綜合利用所學知識分析問題和解決問題的能力。在課程考核中結(jié)合平時書面作業(yè)、遞交上機操作練習和考試三方面情況,綜合評定。平時布置3次思考題目,以書面形式上交,占考核成績的20%;上機實踐操作的習題以電子版發(fā)送到教師的E-mail郵箱中,占考核成績的30%;課程結(jié)束后給學生1周的時間復習,而后在計算機上答題,包括基礎知識部分和上機操作部分,占考核成績的50%。經(jīng)過綜合評定,能夠比較客觀地反映一個學生對該課程的實際掌握情況。采用這種考試方式后,一方面,促使學生在學習過程中,不必花大量工夫去死記硬背,而把重點放在了基本理論、基本知識的鞏固及實踐操作技能的提高上,有效地提高了學生的實踐操作能力和創(chuàng)新能力;另一方面,也促使教師在教學過程中,注重從能力培養(yǎng)的角度進行教學課堂設計,提升教學質(zhì)量和水平。
在教學過程中,通過激發(fā)學生的學習興趣,采用雙語多媒體教學方式,在重視基本理論和基本知識講授的同時,加強上機實踐操作,充分利用網(wǎng)絡教學資源,將科研成果結(jié)合于教學過程中,結(jié)合考試方式改革與探索,大大提高了“生物信息學”課程的教學質(zhì)量水平及教學效果。
[ 參 考 文 獻 ]
[1] 葛威,鮑大鵬,董戰(zhàn)峰,等.Visual BASIC編程在核酸序列分析中的應用研究初探[J].生物信息學,2004,(4):43-46.
篇7
關鍵詞:生物信息學醫(yī)學統(tǒng)計學課堂教學
生物信息學融合了生物技術、計算機技術、數(shù)學和統(tǒng)計學的大量方法,已逐漸成為發(fā)現(xiàn)生命過程中所蘊涵知識的一門重要學科。其基本問題主要包括:DNA分析、蛋白質(zhì)結(jié)構分析、分子進化。醫(yī)學統(tǒng)計學作為醫(yī)科院校的基礎課程之一,長期以來其理論和方法就廣泛應用于臨床醫(yī)學、基礎醫(yī)學的各類研究中。隨著生物新技術的誕生,在推動生物信息學發(fā)展的同時,醫(yī)學研究對象也由宏觀的病人、生物組織拓展到微觀的基因領域,所面對的實驗數(shù)據(jù)在性質(zhì)和結(jié)構上也都有所不同,這對醫(yī)學統(tǒng)計學的應用提出了新的更高的要求。
目前,醫(yī)學統(tǒng)計學的很多原理和方法已成功地應用于這些新研究之中,并在此基礎之上有了新的發(fā)展和改進。如概率分布的知識與序列相似性分析、蛋白質(zhì)分類等技術密切相關;方差分析、非參數(shù)檢驗方法經(jīng)改進和結(jié)合后在基因表達數(shù)據(jù)的前期分析中發(fā)揮了較好的作用;而聚類分析、判別分析、相關分析這些大家所熟知的統(tǒng)計學方法更是在基因分類和調(diào)控網(wǎng)絡的建立中得到了廣泛的應用。在進行醫(yī)學統(tǒng)計學課堂教學時加入生物信息學方面的應用實例,不僅可以使學員了解本學科研究的前沿和醫(yī)學、生物信息學研究的新發(fā)展,還可以提高學員對于醫(yī)學統(tǒng)計學理論學習的興趣,掌握先進的生物實驗數(shù)據(jù)分析方法,提高今后從事醫(yī)學科研的能力。下面,本文在回顧醫(yī)學統(tǒng)計學授課主要內(nèi)容的基礎上,就醫(yī)學和生物信息學中的可能應用舉例如下:
一、概率分布
概率分布(probabilitydistribution)是醫(yī)學統(tǒng)計學中多種統(tǒng)計分析方法的理論基礎。授課內(nèi)容一般包括:二項分布、Possion分布、正態(tài)分布、t分布、F分布等。
借助概率分布常??梢詭椭覀兞私馍笜说奶卣鳌⑨t(yī)學現(xiàn)象的發(fā)生規(guī)律等等。例如,臨床檢驗中計量實驗室指標的參考值范圍就是依據(jù)正態(tài)分布和t分布的原理計算得到;許多醫(yī)學試驗的“陽性”結(jié)果服從二項分布,因此它被廣泛用于化學毒性的生物鑒定、樣本中某疾病陽性率的區(qū)間估計等;而一定人群中諸如遺傳缺陷、癌癥等發(fā)病率很低的非傳染性疾病患病數(shù)或死亡數(shù)的分布,單位面積(或容積)內(nèi)細菌數(shù)的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現(xiàn)象進行研究。
在生物信息學中概率分布也有一定應用。例如,Poisson分布可以用于基因(蛋白質(zhì))序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(zhì)(或DNA)數(shù)據(jù)與公開數(shù)據(jù)庫進行相似性序列比對。對于序列a和b,BLAST發(fā)現(xiàn)的高得分匹配區(qū)稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據(jù)Poisson分布的性質(zhì)計算得到。
二、假設檢驗
假設檢驗(hypothesis)是醫(yī)學統(tǒng)計學中統(tǒng)計推斷部分的重要內(nèi)容。假設檢驗根據(jù)反證法和小概率原理,首先依據(jù)資料性質(zhì)和所需解決的問題,建立檢驗假設;在假設該檢驗假設成立的前提下,采用適當?shù)臋z驗方法,根據(jù)樣本算得相應的檢驗統(tǒng)計量;最后,依據(jù)概率分布的特點和算得的檢驗統(tǒng)計量的大小來判斷是否支持所建立的檢驗假設,進而推斷總體上該假設是否成立。其基本方法包括:u檢驗、t檢驗、方差分析(ANOVA)和非參數(shù)檢驗方法。
假設檢驗為醫(yī)學研究提供了一種很好的由樣本推斷總體的方法。例如,隨機抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數(shù))與該年齡段兒童應有的標準平均身高(總體均數(shù))做u檢驗,其檢驗結(jié)果可以幫助我們推斷出該市該年齡段兒童身高是否與標準身高一致,為了解該市該年齡段兒童的生長發(fā)育水平提供參考。又如,醫(yī)學中常??梢圆捎胻檢驗、秩和檢驗比較兩種藥物的療效有無差別;用2檢驗比較不同治療方法的有效率是否相同等等。
這些假設檢驗的方法在生物實驗資料的分析前期應用較多,但由于研究目的和資料性質(zhì)不同,一般會對某些方法進行適當調(diào)整和結(jié)合。
例如,基于基因芯片實驗數(shù)據(jù)尋找差異表達基因的問題?;蛐酒╣enechip)是近年來實驗分子生物學的技術突破之一,它允許研究者在一次實驗中獲得成千上萬條基因在設定實驗條件下的表達數(shù)據(jù)。為了從這海量的數(shù)據(jù)中尋找有意義的信息,在對基因表達數(shù)據(jù)進行分析的過程中,找到那些在若干實驗組中表達水平有明顯差異的基因是比較基礎和前期的方法。這些基因常常被稱為“差異表達基因”,或者“顯著性基因”。如果將不同實驗條件下某條基因表達水平的重復測量數(shù)據(jù)看作一個樣本,尋找差異表達基因的問題其實就可以采用假設檢驗方法加以解決。
如果表達數(shù)據(jù)服從正態(tài)分布,可以采用t-檢驗(或者方差分析)比較兩樣本(或多樣本)平均表達水平的差異。
但是,由于表達數(shù)據(jù)很難滿足正態(tài)性假定,目前常用的方法基于非參數(shù)檢驗的思想,并對其進行了改進。該方法分為兩步:首先,選擇一個統(tǒng)計量對基因排秩,用秩代替表達值本身;其次,為排秩統(tǒng)計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統(tǒng)計量有:任一特定基因在重復序列中表達水平M值的均值;考慮到基因在不同序列上變異程度的統(tǒng)計量,其中,s是M的標準差;以及用經(jīng)驗Bayes方法修正后的t-統(tǒng)計量:,修正值a由M的方差s2的均數(shù)和標準差估計得到。
三、一些高級統(tǒng)計方法在基因研究中的應用
(一)聚類分析
聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據(jù)聚類對象的某些性質(zhì)與特征,運用統(tǒng)計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內(nèi)的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統(tǒng)計分析方法,其基本內(nèi)容包括:相似性度量方法、系統(tǒng)聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。
聚類分析可以幫助我們解決醫(yī)學中諸如:人的體型分類,某種疾病從發(fā)生、發(fā)展到治愈不同階段的劃分,青少年生長發(fā)育分期的確定等問題。
近年來隨著基因表達譜數(shù)據(jù)的不斷積累,聚類分析已成為發(fā)掘基因信息的有效工具。在基因表達研究中,一項主要的任務是從基因表達數(shù)據(jù)中識別出基因的共同表達模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關聯(lián)性。這種探索完全未知的數(shù)據(jù)特征的方法就是聚類分析,生物信息學中又稱為無監(jiān)督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達數(shù)據(jù)對基因(樣本)進行聚類,將具有相同表達模式的基因(樣本)聚為一類,根據(jù)聚類結(jié)果通過已知基因(樣本)的功能去認識那些未知功能的基因。對于基因表達數(shù)據(jù)而言,系統(tǒng)聚類法易于使用、應用廣泛,其結(jié)果——系統(tǒng)樹圖能提供一個可視化的數(shù)據(jù)結(jié)構,直觀具體,便于理解。而在幾種相似性的計算方法中,平均聯(lián)接法(AverageLinkageClustering)一般能給出較為合理的聚類結(jié)果2。
(二)判別分析
判別分析(discriminantanalysis)是根據(jù)觀測到的某些指標的數(shù)據(jù)對所研究的對象建立判別函數(shù),并進行分類的一種多元統(tǒng)計分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經(jīng)網(wǎng)絡(ANNs)和支持向量機(SVMs)。
判別分析常用于臨床輔助鑒別診斷,計量診斷學就是以判別分析為主要基礎迅速發(fā)展起來的一門科學。如臨床醫(yī)生根據(jù)患者的主訴、體征及檢查結(jié)果作出診斷;根據(jù)各種癥狀的嚴重程度預測病人的預后或進行某些治療方法的療效評估;以及流行病學中某些疾病的早期預報,環(huán)境污染程度的堅定及環(huán)保措施、勞保措施的效果評估等。
在生物信息學針對基因的研究工作中,由于借助了精確的生物實驗,研究者通常能得到基因(樣本)的準確分類,如,基因的功能類、樣本歸結(jié)于疾?。ㄕ#顟B(tài)等等。當利用了這些分類信息時,就可以采用判別分析的方法對基因進行分類,生物信息學中又稱為有監(jiān)督的分析(SupervisedAnalysis)。例如,基因表達數(shù)據(jù)分析中,對于已經(jīng)過濾的基因,前三種方法的應用較為簡單。而支持向量機(SVMs)和人工神經(jīng)網(wǎng)絡(ANNs)是兩種較新,但很有應用前景的方法。
(三)相關分析
相關分析(correlationanalysis)是醫(yī)學統(tǒng)計學中研究兩變量間關系的重要方法。它借助相關系數(shù)來衡量兩變量之間的關系是否存在、關系的強弱,以及相互影響的方向。其基本內(nèi)容包括:線性相關系數(shù)、秩相關系數(shù)、相關系數(shù)的檢驗、典型相關分析等。
我們常??梢越柚嚓P分析判斷研究者所感興趣的兩個醫(yī)學現(xiàn)象之間是否存在聯(lián)系。例如,采用秩相關分析我們發(fā)現(xiàn)某種食物中黃曲霉毒素相對含量與肝癌死亡率間存在正相關關系;采用線性相關方法發(fā)現(xiàn)中年女性體重與血壓之間具有非常密切的正相關關系等等。
生物信息學中可以利用相關分析建立基因調(diào)控網(wǎng)絡。如果將兩個不同的基因在不同實驗條件下的表達看作是兩個變量,相關分析所研究的正是兩者之間的調(diào)控關系。如采用線性相關系數(shù)進行兩基因關系的分析時,其大小反應了基因調(diào)控關系的強弱,符號則反應了兩基因是協(xié)同關系(相關系數(shù)為正),還是抑制關系(相關系數(shù)為負)。
四、意義
篇8
【關鍵詞】 生物信息學 序列比對 準確率 時空效率
隨著生命科學研究的興起和計算機技術的飛速發(fā)展,生物信息學已成為自然科學的核心領域之一[1]。基因序列比對是生物信息處理的最基本方法,對發(fā)現(xiàn)基因功能、比較基因、探究生物進化等具有非常重要的作用。
1 序列比對算法概述
所謂序列比對[2],是指兩個或多個序列按字母比較,盡可能確切地反映它們之間的相似和相異性,用于闡明序列之間的同源關系。通過序列比對,找出序列之間的相似性,發(fā)現(xiàn)與結(jié)構相聯(lián)系的保守序列片段,以及檢測新測定序列與數(shù)據(jù)庫中已知結(jié)構和功能的序列之間的相似性關系,從而以足夠的可信度確定新序列的結(jié)構和功能信息。
目前已知的序列比對方法很多。本文主要針對常用的算法,按照比對的序列數(shù)目進行相關介紹:
1.1 雙序列比對
根據(jù)算法結(jié)構的不同,將雙序列比對算法分為三類[3]:動態(tài)規(guī)劃的優(yōu)化方法,啟發(fā)式算法和大型數(shù)據(jù)庫搜索設計的概率方法。
1.1.1 動態(tài)規(guī)劃的優(yōu)化算法
Needleman-Wunsch算法是最早的序列比對算法,屬于全局序列比對,在生物信息處理中應用廣泛。Smith-Waterman算法是一種局部相似性的動態(tài)規(guī)劃算法,在識別局部相似性時具有很高的靈敏度,是雙序列比對算法中最基本的算法。
1.1.2 啟發(fā)式算法
1)FASTA算法
FASTA是雙序列比對啟發(fā)式算法,采用了改進的wilbllr和Lipmall算法以集中反映具有顯著意義的比對結(jié)果。
它的基本思想是:一個能揭示出真實序列關系的比對至少包含一個兩條序列都擁有的片段,把查詢序列中的所有片段編成Hash表,然后在數(shù)據(jù)庫搜索時查詢這個Hash表,以檢索出可能的匹配,這樣命中的片段就能很快地被鑒定出來。
2)BLAST算法
BLAST算法可以兼顧搜尋的速度以及搜尋結(jié)果的精確度,它比FASTA速度更快。它的基本思想是:產(chǎn)生比FASTA更少而更有意義的增強點,以提高整個算法的速度。BLAST算法在不失敏感性的前提下大大提高了算法的效率。
3)BLAT算法
Blat算法最初用于人類基因組拼接和注釋過程中的大規(guī)模數(shù)據(jù)比對任務上。其速度快、共線性輸出結(jié)果簡單易讀,存在的局限性是對于特殊的任務需要選擇合適的軟件,如:用于遠親緣物種間的核酸序列比對時,比對精度就不夠高;在重復搜索短小匹配片段的同時,會產(chǎn)生過多的沒有生物學意義的序列比對碎片。
1.1.3 大型數(shù)據(jù)庫搜索設計的概率方法為基礎的算法
MUMmer算法是一種基于后綴樹數(shù)據(jù)結(jié)構的全基因組比對方法,利用后綴樹的數(shù)據(jù)結(jié)構有效地將算法的時間和空間復雜度由(N 3)降到了(N)。與BLAST算法相比,其后綴樹法在速度上快得多,且能處理大量的插入和刪除片段,能識別重復片段和單核酸多態(tài)性等多種全基因組序列中的復雜片段。
1.2 多序列比對
多序列比對的常用算法有累進算法、隱馬爾科夫模型、迭代比對法等。
累進方法是最常用的啟發(fā)式多序列比對算法。其中的CLUSTAL算法是由Feng和Doolittle提出的,基于相似序列通常具有進化相關性這一假設的算法,它是多序列比對算法中使用最廣泛的。
隱馬爾科夫模型是目前較先進的多序列比對方法,跟常規(guī)的方法相比,它可以發(fā)現(xiàn)序列久遠的同源性。
迭代方法也基于一個能產(chǎn)生比對的算法,并通過迭代方式精細多序列比對,直到比對結(jié)果不再改進為止。這類算法不能提供獲得優(yōu)化比對結(jié)果的保證,但卻具有魯棒性和對序列個數(shù)不敏感等特性。
2 序列比對算法比較
通過上述介紹,本文對幾種最常用的基因序列比對算法進行如下比較(如表1):
在實際試驗中處理生物信息數(shù)據(jù)時,考慮各種序列比對算法的速度和適用范圍,啟發(fā)式算法的應用最為廣泛。進一步,雖然BLAT算法的適用范圍較BLAST小,但兩者原理相似,且BLAT速度更快,便于處理大量的基因數(shù)據(jù),在進行簡單的DNA基因序列比對任務時,研究者更青睞BLAT算法。
3 結(jié)語
序列比對是生物信息學中最重要、最基本的方法,對于從大量生物數(shù)據(jù)中提取有價值的信息有重大的意義。
我國在序列比對方面研究較為落后,且目前提出的算法較少,大多數(shù)都是在幾種基本序列比對算法的基礎上進行的改進。如:張濤濤、郭茂祖等介紹了一種參數(shù)序列比對方法[4],該方法把最佳比對作為權值和罰分的函數(shù),可以系統(tǒng)地得到參數(shù)的選擇對最佳比對結(jié)果的影響。
準確率和運算速度是評價序列比對算法的重要依據(jù),因此,獲得比對準確率更高、時間空間效率更好的序列比對算法是生物信息學研究的一個重要課題。
參考文獻:
[1]許忠能著.生物信息學[M].北京:清華大學出版社,2009.
[2]何萬雙.雙序列比對算法研究[D].湖南:國防科技大學,2006.
篇9
【關鍵詞】生物技術;計算機;應用
【中圖分類號】Q50 【文獻標識碼】A 【文章編號】1672-5158(2013)01―0046-01
進入二十一世紀以來,由于研究的深入,對知識的進一步認識和了解,許多學科之間都有了一些交叉,尤其是一些新興學科之間的相互交叉,廣泛滲透更是對科學的發(fā)展起了很大的促進作用,人們進一步提升對自然界的認識,對人類本身也有了進一步的了解。隨著科學技術的不斷發(fā)展,尤其是計算機技術的飛速發(fā)展,計算機在其中的應用范圍也日益擴大,計算機和藥學兩者互相影響、互相滲透、互相結(jié)合,密不可分。
1、生物技術與信息技術的關系
信息技術和生物技術都是高新技術,二者在新經(jīng)濟中并非此消彼長的關系,而是相輔相成,共同推進21世紀經(jīng)濟的快速發(fā)展。信息技術為生物技術的發(fā)展提供強有力的計算工具。在現(xiàn)代生物技術發(fā)展過程中,計算機與高性能的計算技術發(fā)揮了巨大的推動作用。如今,人們越來越清醒地認識到,超級計算機在創(chuàng)造新品種的藥物、治愈疾病以及最終使我們能夠修復人類基因缺陷等方面是至關重要的,高性能計算可以為人類作出更大的貢獻。生物技術推動超級計算機產(chǎn)業(yè)的發(fā)展。隨著人類基因組計劃各項任務的完成,有關核酸、蛋白質(zhì)的序列和結(jié)構數(shù)據(jù)呈指數(shù)增長。面對如此巨大而復雜的數(shù)據(jù),只有運用計算機進行數(shù)據(jù)管理、控制誤差、加速分析過程,使得人類最終能夠從中受益。然而要完成這些過程,并非一般的計算機力所能及,而需要具有超級計算能力的計算機。因此,生物技術的發(fā)展將對信息技術提出更高的需求,從而推動信息產(chǎn)業(yè)的發(fā)展。生物技術將從根本上突破計算機的物理極限。運用數(shù)學、計算機科學和生物學的各種工具,來闡明和理解大量基因組研究獲得數(shù)據(jù)中所包含的生物學意義,生物學和信息學交叉、結(jié)合,從而形成了一個新的學科。生物信息學或信息生物學,它的進步所帶來的效益是不可估量的。
2、計算機在生物技術中的應用分析
生物醫(yī)學工程運用現(xiàn)代自然科學和技術科學的原理和方法,從工程學的角度研究人體的結(jié)構、功能及其相互關系以及其他生命現(xiàn)象。其目的是解決醫(yī)學問題,即研究和開發(fā)為防病、治病以及人體功能輔助等醫(yī)學應用的裝置和系統(tǒng)。用技術科學的概念和方法來解釋和描述人體各層次的成份、結(jié)構和功能,以及人體各種正常生理功能和病理狀態(tài)之問的差異,這些內(nèi)容形成了這個學科的基礎部分。而防病、診斷、治療及功能輔助的具體技術和設備則形成這個學科的應用部分。
2.1 計算機技術在生物信息學中的應用
生物信息學在今后的無論是生物醫(yī)藥科研還是開發(fā)中都具有廣泛而關鍵的應用價值;而且,由于生物信息學是生物科學與計算科學、物理學、化學和計算機網(wǎng)絡技術等密切結(jié)合的交叉性學科,使其具有非常強的專業(yè)性,這就使得專業(yè)的生物醫(yī)藥科研或開發(fā)機構自身難以勝任它們所必需的生物信息學業(yè)務,殘酷的市場競爭及其所帶來的市場高度專業(yè)化分工的趨勢,使得專業(yè)的生物醫(yī)藥開發(fā)機構不可能在自身內(nèi)部解決對生物信息學服務的迫切需求,學術界內(nèi)的生物醫(yī)藥科研機構也是如此,而這種需求,僅靠那些高度分支化和學術化的分散的生物信息學科研機構是遠遠不能滿足的??梢姡谏茖W的新世紀,生物信息學綜合服務將是一個非常重要的也是一個極具挑戰(zhàn)性的領域。
2.2 計算機在微生物學中細菌生化反應上的應用
細菌學的計量檢驗是醫(yī)學檢驗現(xiàn)代化的種重要手段。此檢驗技術是通過收集已確證的統(tǒng)計資料,并將系列生化反應試驗的反應結(jié)果數(shù)值化,按照一定的數(shù)學模型進行多元分析,利計算機的運算速度和記憶能力,檢驗標本作出規(guī)范化的定量鑒定。實現(xiàn)這一計量鑒定,我采用了計算機輔助編碼撿索系統(tǒng)(CAIS)菌科細菌系列生化反應機輔檢索程序(CAE-15)、(eAE-I)輸入微機。通過各項生化反應結(jié)果及增補試驗結(jié)果所得的編碼數(shù)經(jīng)過人工查詢,從計算機編程的“縮碼檢索手冊”中直接查找指定編碼的細菌概率分布和相應的補充試驗。計算機在微生物中的應用,不僅節(jié)約了時間和人力,而且鑒定結(jié)果準確可靠,避免主觀誤。
2.3 計算機在破譯遺傳密碼和管理基因數(shù)據(jù)方面的應用
計算機在破譯遺傳密碼和管理基因數(shù)據(jù)方面的潛力,在加利福尼亞大學圣迭分校的生物化學教授杜利特爾及其同事的工作中得以體現(xiàn)。他們在年進行的工作中只通過分析計算機打印輸出的數(shù)據(jù)就獲得了一個重要的生物學發(fā)現(xiàn)。杜利特爾教授的研究小組比較了兩個由計算機打印輸出的蛋白質(zhì)序列,發(fā)現(xiàn)一種與癌癥發(fā)生有關的序列和一種與細胞生長有關的序列完全一樣,揭示出癌基因引起了細胞的不正常生長。這一發(fā)現(xiàn)在沒有進行過任何一實驗的情況下就獲得了。
2.4 計算機在創(chuàng)造生物的虛擬環(huán)境方面的應用
計算機還正被用于創(chuàng)造一個虛擬的生物環(huán)境,以便對復雜的生物網(wǎng)絡和生態(tài)系統(tǒng)進行模擬。這種虛擬環(huán)境創(chuàng)造不同的情境,幫助研究人員產(chǎn)生新的假說,并在實驗室里被用于檢測新的農(nóng)業(yè)和制藥產(chǎn)品以及醫(yī)學活體實驗。在虛擬世界里,生物學家敲敲鍵盤就可以產(chǎn)生新的合成分,而在實驗室經(jīng)常需要幾年時間才可能合成一個真正的分子。有了三維的計算機模型,研究人員可以在屏幕上將各種基因和分子進行組合,然后觀察它們的相互作用情況。年,賓夕法尼亞州立大學和位于加利福尼亞拉霍亞的斯克里普斯臨床研究所的研究人員,通過使用最先進的計算機首次設計了一種極有價值的合成分子。這種被命名為的化合物是在計算機屏幕上構想出來的,幾家生物技術實驗室正在進行該化合物的批量生產(chǎn)。科學家們打算通過使用新的信息時代的計算技術造出多種多樣的新分子。
2.5 計算機在生物醫(yī)學工程中的具體應用
生物醫(yī)學工程運用現(xiàn)代自然科學和技術科學的原理和方法,從工程學的角度研究人體的結(jié)構、功能及其相互關系以及其他生命現(xiàn)象。其目的是解決醫(yī)學問題,即研究和開發(fā)為防病、治病以及人體功能輔助等醫(yī)學應用的裝置和系統(tǒng)。用技術科學的概念和方法來解釋和描述人體各層次的成份、結(jié)構和功能,以及人體各種正常生理功能和病理狀態(tài)之間的差異,這些內(nèi)容形成了這個學科的基礎部分。而防病、診斷、治療及功能輔助的具體技術和設備則形成這個學科的應用部分。
3、發(fā)展前景
計算機在生物醫(yī)學工程中應用的例子還很多,并且發(fā)揮著越來越重要的作用,同時對計算機技術水平的要求也越來越高。比如在生物醫(yī)學信號處理方面,普通的計算機已經(jīng)很難勝任實時處理的能力,使人們轉(zhuǎn)向研究處理速度更快的專門處理器件DSP芯片。在人工智能方面,往往還需要功耗更低、存儲更大的微計算機。因此,生物醫(yī)學工程在利用計算機的同時也促進了計算機的發(fā)展。二十一世紀是生物技術的世紀,信息生物學是自然科學中發(fā)展最迅速、最具活力和生氣的領域,并且為人類帶來了很大的便利與貢獻。不難看出,生物計算機研制成功以后,又會帶來一次革命,它將會給人類帶來更多的福祉,世人將以期盼的心情等待它的出現(xiàn)。隨著科技的發(fā)展,隨著生物技術的發(fā)展,它將越來越離不開計算機。不但如此,計算機和生物技術更越來越緊密結(jié)合。將更快地促進兩者的發(fā)展。
參考文獻
[1]張宜,湯韌.計算機單機及局域網(wǎng)在藥學領域應用發(fā)展回顧及現(xiàn)狀[J].武漢總醫(yī)院雜志,2005,13(4):12
篇10
關鍵字 蛋白質(zhì)組;蛋白質(zhì)組學;研究技術;分離技術
中圖分類號 Q-0 文獻標識碼A 文章編號 1674-6708(2013)107-0135-02
0 引言
近幾年基因組學的不斷發(fā)展與壯大,推動了生物學技術的快速發(fā)展,使得我國在生物技術方面的研究走向成熟,大部分的病毒和原核生物等簡單生物的基因組工作已經(jīng)完成,而且高等生物的基因組工作也取得了很大的進步,人類的基因組研究已經(jīng)順利完成。隨著科技的不斷發(fā)展,在生物學界產(chǎn)生了許多新的技術,新的基因組研究手段與方法,可以實現(xiàn)對數(shù)以萬計的基因表達進行檢測。但是,這僅僅在生物功能的靜態(tài)分析上取得了很大的進步,卻依然不能達到對基因組學研究的目的。正因如此,越來越多的專家將研究矛頭指向了蛋白質(zhì)組的研究。只有研究基因編碼和翻譯的蛋白質(zhì),才能真正的了解到生物的活動特征。
1 蛋白質(zhì)組概念和蛋白質(zhì)組學研究的范圍
在20世紀90年代根據(jù)蛋白質(zhì)和基因組的技術提出了蛋白質(zhì)組的概念,蛋白質(zhì)組指的是一組基因或者細胞所有的蛋白質(zhì)表達的情況,與基因組類似,但是與基因組不同的是,蛋白質(zhì)組更注重于對研究體代謝的一系列動態(tài)過程進行研究。從蛋白質(zhì)組的名稱上可以了解到,蛋白質(zhì)組不是針對于單一的蛋白質(zhì)進行研究,而是把一組蛋白質(zhì)的整體作為研究對象,最后分析出每個蛋白質(zhì)的表達信息。蛋白質(zhì)組學是由于蛋白質(zhì)組的出現(xiàn)而興起的一門生物技術學科,蛋白質(zhì)組學,即一個基因組,一個細胞或組織,一種生物在一定時間,一定條件下所表達的全部蛋白組成,存在形式,活動方式及時空動態(tài)。目前蛋白質(zhì)組學主要研究生理、病理或不同發(fā)育階段下蛋白質(zhì)的表達情況,對表達存在差異的蛋白質(zhì)進行進一步研究,分析蛋白質(zhì)之間的相互作用,蛋白質(zhì)的組成結(jié)構,以及蛋白質(zhì)的翻譯和定位情況等。
2 蛋白質(zhì)組研究的主流技術
蛋白質(zhì)組研究的進展與蛋白質(zhì)組研究技術的發(fā)展是不可分開的,二者之間起到相互促進的作用。隨著科學的進步,對于使用生物技術進行研究的結(jié)果要求越來越高,對數(shù)據(jù)要求也越來越精確,所以蛋白質(zhì)組研究的技術也在不斷創(chuàng)新與更新,目前針對于蛋白質(zhì)的分離來說,蛋白質(zhì)組研究的主流技術包括雙向凝膠電泳技術、差異凝膠電泳技術、質(zhì)譜技術以及多維液相色譜技術等。
2.1雙向凝膠電泳技術
傳統(tǒng)的雙向凝膠電泳技術由1975年建立,采用雙向凝膠電泳技術進行蛋白質(zhì)組分離大大的提高了分辨率,因此,在蛋白質(zhì)組研究技術中一直被廣泛采用。其產(chǎn)生雙向的原理是:第一向為等電聚焦,使得帶有不同電荷量的蛋白質(zhì)產(chǎn)生電泳分離,第二向為SDS-聚丙烯酰胺凝膠電泳,使得具有不同分子量的蛋白質(zhì)產(chǎn)生電泳分離。
隨著技術的提高,雙向凝膠電泳技術也進行了完善,目前所使用的雙向凝膠電泳技術中第一向利用固相pH梯度等電聚焦電泳技術來達到蛋白質(zhì)組分離的效果,這樣可以在保證在高分辨率的前提下,提高重復性,而且可以獲得蛋白質(zhì)具有的分子量多少以及其等電點信息,但是,這種方法難以實現(xiàn)對于極大蛋白質(zhì)、極小蛋白質(zhì)、極堿性蛋白質(zhì)和疏水性蛋白質(zhì)進行有效分離分析與研究。
2.2差異凝膠電泳技術
差異凝膠電泳技術是在雙向凝膠電泳技術上發(fā)展起來的,差異凝膠電泳技術在一定程度上彌補了雙向凝膠電泳技術的不足,不但提高了蛋白質(zhì)組的分離效率,而且降低了勞動強度,最重要的是提高了電泳的靈敏程度。差異凝膠電泳技術的原理是對兩份不同的蛋白質(zhì)組研究樣品做不同的標記,然后放在同一環(huán)境下進行凝膠電泳,可以直觀的觀察到正常的基因組和癌變的基因組的凝膠電泳結(jié)果的區(qū)別,繼而可以對兩種不同的蛋白質(zhì)表達結(jié)果進行進一步分析與研究。
2.3質(zhì)譜技術
采用質(zhì)譜技術對蛋白質(zhì)組進行分離的原理是:首先將蛋白質(zhì)組研究樣品的分子進行離子化,然后根據(jù)不同離子的質(zhì)荷比不同來確定其分子量,最后實現(xiàn)對其進行分離。在進行蛋白質(zhì)組樣品分子進行離子化的時候,需要保證分子的完整性,盡量不要形成碎片離子。質(zhì)譜技術通過與其他高端技術的配合,可以實現(xiàn)對多肽的序列進行測量。
2.4多維液相色譜技術
多維液相色譜技術是蛋白質(zhì)組研究過程中最常用的色譜分離技術之一,主要是通過多種色譜分離技術的聯(lián)合使用來達到多維的效果,由于科學技術的更新速度比較快,而且生物技術研究的數(shù)據(jù)量越來越多,蛋白質(zhì)組研究的樣品復雜程度越來越高,所以實現(xiàn)蛋白質(zhì)組自動化分離成為必然趨勢,目前,蛋白質(zhì)組自動化分離系統(tǒng)已經(jīng)形成,就是將多維液相色譜技術與串聯(lián)質(zhì)譜技術聯(lián)合使用便可以達到快速、高效、精確的蛋白質(zhì)組自動化分離。但是,這種蛋白質(zhì)組分離技術依然存在一定的不足,譬如,不能實現(xiàn)將分子量過小的蛋白質(zhì)進行分離以及不能對蛋白質(zhì)的差異表達進行分析等。
3 蛋白質(zhì)組生物信息學
近幾年來,蛋白質(zhì)組研究技術已經(jīng)得到了生物信息學的高度重視,甚至大部分國家政府已經(jīng)大力支持蛋白質(zhì)組的研究,蛋白質(zhì)組的研究為生物學和醫(yī)學做出了很大的貢獻,蛋白質(zhì)組研究技術的發(fā)展推動了我國生物學與醫(yī)學的快速發(fā)展,同時生物信息學的發(fā)展也為蛋白質(zhì)組的研究工作提供有力的保證,生物信息學是在生命科學、計算機技術與嚴密、精確的數(shù)學科學計算上發(fā)展的交叉型學科,通過對生命科學樣本的研究,以及運用數(shù)學分析與計算,利用計算機技術手段實現(xiàn)將得到的數(shù)據(jù)和結(jié)論信息進行收集、加工和存儲。
4 結(jié)論
由于生物學科學技術的提高,蛋白質(zhì)組學得到了廣泛的重視,同時也受到了許多政府的大力支持,成為了基因組計劃研究的核心,蛋白質(zhì)領域的建立為生物學家進行蛋白質(zhì)結(jié)構的研究提供了新的角度與新的研究理念。蛋白質(zhì)組技術的發(fā)展,對一些細菌蛋白質(zhì)的研究和對分析疾病的產(chǎn)生原因與治療起著深遠的影響與重要的意義。
參考文獻
[1]成海平,錢小紅.蛋白質(zhì)組研究的技術體系及其進展[J].生物化學與生物物理進展,2000(27):584-588.
[2]解建勛,蒲小平,李玉珍,李長齡.蛋白質(zhì)組分析技術進展[J].生物物理學報,2001(1):119-126.