我今天要講一講生物信息學。生物信息學是我們講的很多,是前面講話者講話的基礎。生物基因組是很好的例子,我們要依賴生物信息技術、生物信息學來幫助我們瞭解很多內容。我所在的單位所研究的結果也很大程度上依賴於生活信息基礎的研究,我首先談一下定義。
生物信息學是對計算機數據存儲提出的一些要求,它涉及到一些數據、數據庫的存儲,我們有一個圖,這個圖就表明生物信息學所涉及的領域,上面有生物,下面是生理學,生物信息學是處在中間的,這邊有生物學家使用這些項目來分析他們的數據,中間就是象我這樣的工作人員,通過電腦來研究,並且使用這些數據。
生物信息學方面有一些重大的挑戰,第一個挑戰就是信息的大爆炸。我曾經與一個專家,他是這個發起者之一,他說到2001年的時候將會有40000個基點,但是我們知道人類基因圖譜當中有百萬個基點,所以我們要處理這麼大數量的數據,我們現在已經破解了人類基因組的圖譜,我們要使用新的技術來解釋這些圖譜,我們還需要更多的軟件,以便於進行假設性的研究和分析。
這裏有一個重要的問題,這是年輕的領域,而且是發展非常快的領域,我們需要有一個非常好用,並且有非常好理解生物的軟件,我們讓生物學家來找到辦法,來應用這些程序和其中的數據。這個圖表顯示了數據庫的增長,日本和歐洲的數據大家可以看到,我們已經有了200億個基本數據,計算能力每18個月增加1倍,同時也要增加我們硬件的能力處理這樣的數據。
在基因圖譜當中,我們做了幾項工作,轉換工作和基因尋找工作,這張幻燈片只說明瞭生物信息學很少的一部分,我們用的是在這方面有經驗的人幫我們找到,什麼樣的方法是外來分析找到這樣的數據的路徑,我們問題的另一部分,我們做分析的時候,我們有大量的軟件可供你用。
我給大家舉一個網站的例子,它有50個分析的項目,存儲了大量的信息,有很多人幫助解決這個問題,使軟件進行改制。在新技術方面,我們有一些象蛋白質組的實驗等等,我們有大量的圖象文件存儲到文件答案當中,並且在這方面沒有全球統一的標準,我舉一個例子這是美國基因組研究中心的數據庫的圖象,這只是一個實驗室的一組數據,大家可以看到他們需要這樣的數據庫的管理來對數據進行分析。那麼這個例子職能佔了1%到2%。這樣就談到我們澳大利亞這個機構,我們主要是提供生物信息的服務,無論是對澳大利亞人,還是對海外的人士這樣的服務都是適用的。有一個擁有200億基本數據的這樣一個可以供下載的數據庫,從我們這個網站下載每個人都可以受益,這樣的商務網站我們可以提供集中化的准入,並且可以提供折扣,並且可以想我們的用戶顯示怎麼樣的程序怎麼樣的用法是最好。也介紹數據庫、軟件這些方面。同時我們通過網站來開展我們的工作,只要你有一個瀏覽器就可以看到我們的程序,同時我們有一箇中心提供培訓,使之符合澳大利亞的科學家的需要。
現在我們有四千個用戶,這也就是說明要有一個集中性的資源管理。使得這個國家,我們國家的每一個人都能夠進入我們這個網站。這符合我們這個中心的構架,四千名用戶,用我們這個網站來作爲一個培訓的工具。最後我們的軟件由我們在全澳也做培訓項目,提供諮詢工作並且提供文件整理工作和網上資源工作。1991年在這個行業開展工作,現在我們在這方面的工作經驗已經有二十年,主要是向生物學家提供生物信息,我們的界面非常簡單。在過去的十一年當中我們發展漸漸多了,更加複雜更加緊密這樣的應用的方式。先跟大家談一談我們生物管理者這個項目。這個是我們的最新的產品,我們提供很多對免費網站的准入,以及免費軟件的准入。這個界面和現有的界面使用起來更加的便捷。現在我們正在對我們的軟件進行升級讓它有更多的特性。我們現在加入了歐洲分子科學網的內容,並且提供給了我們的用戶,這向大家說明了我們如何去服務於生物學家。大家看到不同的圖標,無論是一個蛋白質組都有相應的聯繫,你不要擔心它是一種什麼樣的形式。分子可以適應不同的形式。
我們在網站上也可以複製信息,然後加以粘貼。首先,我們的用法先讓你得到數據,然後再瞭解程序,別的用戶的做法是先了解程序,然後再下載數據。我們進行文件整理、檢索等等工作。在做這個程序的時候,我們的解讀是非常的建議,我們用的標準化的界面,我們有一個從上到下的列表,提供的所有的操作的選擇。我們還提供了一些檢驗的工具,能夠讓你確認你的接入沒有發生錯誤,同時我們也提供了一些分析的工具我們不用去想一想它的背景文件是怎麼樣的。所以你可以看看我們在網上提供了多少的特性,多少的字符,我們的這個排組,同時也可以來看一看你要看的產品當中它的化學特性是什麼樣的。在做這個數據庫瀏覽的檢索的時候,我們有一個非常好的一個文本檢索系統,我們這個系統可以很幫助你找到你要找的蛋白質組等等,你先去選擇一種檢索的程序,不需要對你的介入近來一個重新的格式上的界定就可以實現檢索功能了。
我們的系統的另一方面就是一個對於過去情況的檢索。點擊一個項目之後這個數據文件的過去的情況就自然的顯示出來,你可以看一看和它最接近的這些文件。你可以把它作爲一個單獨的程序加以運行。只要通過一次就可以把你選定的程序加以運作了。
作爲結束語我想談一談我們公司的未來和整個生物信息學的狀況。我們現在想做的工作就是用一種一體化的界面來存儲所有的數據,很多其他公司做的都是一些部分性的解決方案。沒有一個公司能夠帶來一個完全一體化的解決方案,我認爲這是非常重要的。醫生在用這樣的數據的時候,要有病人的情況,病人的病史,病人的用藥情況,用我們這樣一個界面使之成爲現實。但是,這種整合性的界面是一個艱鉅的任務,要有一個速度很快的服務器,要有專門的工作人員,我們正在澳大利亞審視一些模式,這是我們公司做的工作,還有其他地區的一些工作,但我們希望對這種數據實現中央存儲。對我們公司來說,對於生物信息來說,如果我們的程序,我們的界面不能夠很快的推上市場,加以促銷的話,那麼沒有人看到這樣的產品。我就講到這兒,謝謝主辦單位邀請我到這兒來發言。謝謝!
|