Informasi Lengkap Latar Belakang Sejarah Database Protein

Secara historis, database protein disiapkan terlebih dahulu, kemudian database nukleotida. Pada tahun 1959, VM Ingram pertama kali mencoba membandingkan hemoglobin sel sabit dan hemoglobin normal, dan mendemonstrasikan homologinya. Pada waktunya, protein lain yang terkait dengan fungsi biologis serupa juga dibandingkan.

Ini menghasilkan lebih banyak pengurutan protein dan akumulasi informasi yang luas. Oleh karena itu, disadari untuk memiliki database sehingga dengan menggunakan perangkat lunak perhitungan protein dapat dibandingkan dengan cepat.

Pada tahun 1962, dengan menggunakan variabilitas urutan, Zuckerkandl dan Pauling mengusulkan strategi baru untuk mempelajari hubungan evolusi antara organisme yang disebut ‘evolusi molekuler’. Teori ini didasarkan pada fakta bahwa ada kesamaan di antara urutan protein yang terkait secara fungsional (homolog).

Margaret O. Dayhoff menemukan bahwa selama evolusi sekuens protein mengalami perubahan menurut pola tertentu seperti: (i) perubahan preferensial (penggantian) asam amino dengan asam amino yang memiliki karakteristik fisika-kimia yang serupa (namun tidak secara acak), (ii) tidak ada penggantian dari beberapa asam amino (misalnya triptofan) oleh asam amino lainnya, dan (iii) pengembangan mutasi yang diterima titik (PAM) berdasarkan beberapa urutan homolog.

Pekerjaan lebih lanjut pada perbandingan urutan berdasarkan strategi kuantitatif dilakukan. Pada tahun 1965, Dayhoff dan rekan kerjanya mengumpulkan semua urutan protein yang dikenal pada waktu itu dan membuat katalognya sebagai Atlas Urutan dan Struktur Protein yang pertama kali diterbitkan oleh National Biomedical Research Foundation (Silver Sring MD).

Kemudian koleksi sekuens makromolekul tersebut diterbitkan dengan judul di atas dari tahun 1965 hingga 1978. Buku cetak di atas meletakkan dasar untuk sumber daya yang sekarang bergantung pada seluruh komunitas bioteknologi untuk pekerjaan sehari-hari dalam biologi komputasi.

Pengembangan metode komputer yang dipelopori oleh Dayhoff dan kelompok penelitiannya dapat diterapkan: (i) dalam membandingkan sekuens protein, (ii) mendeteksi sekuens yang berkerabat jauh dan duplikasi di dalam sekuens, dan (iii) menyimpulkan sejarah evolusioner dari penyelarasan sekuens protein.

Pada tahun 1980, munculnya database sekuens DNA mengarah ke fase berikutnya dalam informasi sekuens database melalui pembentukan perpustakaan data oleh European Molecular Biology Laboratory (EMBL).

Tujuan pembuatan perpustakaan data adalah untuk mengumpulkan, mengatur, dan mendistribusikan data tentang urutan nukleotida dan informasi lain yang terkait dengannya. Institut Bioinformatika Eropa (EBI) adalah penggantinya yang terletak di Hinxton, Cambridge, Inggris.

Pada tahun 1984, National Biomedical Research Foundation (NBRF) mendirikan sumber informasi protein (PIR). NBRF membantu para ilmuwan dalam mengidentifikasi dan menafsirkan informasi urutan protein.

Pada tahun 1988, National Institute of Health (NIH), USA mengembangkan National Center for Biotechnology Information (NCBI) sebagai divisi dari National Library of Medicine (NLM) untuk mengembangkan sistem informasi dalam biologi molekuler. Bank Data DNA Jepang (DDBJ) di Mishima bergabung dengan kolaborasi pengumpulan data beberapa tahun kemudian.

NCBI membangun GenBank, database urutan genetik National Institute of Health (NIH). GenBank adalah kumpulan beranotasi dari semua sekuens nukleotida dan protein yang tersedia untuk umum. Catatan dalam GenBank mewakili pemilihan contig (contiguous) tunggal dari DNA atau RNA dengan anotasi.

Pada tahun 1988, tiga mitra (DDBJ, EMBL dan GenBank) dari International Nucleotide Sequence Database Collaboration mengadakan pertemuan dan sepakat untuk menggunakan format yang sama. Ketiga pusat tersebut menyediakan titik pengiriman data yang terpisah, namun pertukaran informasi ini setiap hari membuat database yang sama tersedia secara luas.

Ketiga pusat tersebut mengumpulkan, mengirimkan langsung dan mendistribusikannya sehingga masing-masing pusat memiliki salinan dari semua urutan. Oleh karena itu, mereka dapat bertindak sebagai pusat distribusi utama untuk urutan ini. Selain itu, semua database memiliki kolaborasi satu sama lain. Mereka secara teratur bertukar data mereka.

Sekarang data urutan terakumulasi dari hari ke hari. Oleh karena itu, diperlukan perangkat lunak yang kuat agar urutan dapat dianalisis. Untuk pengembangan algoritma [setiap urutan tindakan (misalnya langkah komputasi) yang melakukan tugas tertentu] dasar matematika yang kuat diperlukan.

Sekarang, ahli matematika, ahli biologi, dan ilmuwan komputer sangat tertarik dengan bioinformatika. Selain itu, ahli biologi penasaran untuk bertanya reservoir dari semua informasi tersebut karena mereka saling berhubungan secara luas melalui jaringan.

Jadi bioinformatika ditujukan untuk (0 pengembangan perangkat lunak yang kuat untuk analisis data, dan (ii) menguntungkan para peneliti melalui penyebaran pengetahuan yang diselidiki secara ilmiah, dll. Monomer nukleotida dan asam amino diwakili oleh huruf terbatas.

Sifat-sifat biopolimer yaitu makromolekul (misalnya protein DNA, RNA) sedemikian rupa sehingga dapat diubah menjadi sekuens yang memiliki simbol digital. Data genetik dan data biologis lainnya dibedakan oleh data digital ini. Hal ini mengakibatkan kemajuan bioinformatika.

Related Posts