Xây dựng bộ cơ sở dữ liệu CHD hỗ trợ việc định loại Haplotype ở chó nhà

Nghiên cứu ứng dụng tin sinh học để xác định các SNPs trên hệ gene ty thể ở chó nhà để định loại haplotype một cách nhanh chóng và chính xác đã được nhóm nghiên cứu Khoa Công nghệ Sinh học NTTU tiến hành vài năm gần đây.

Những năm gần đây với sự hiểu biết vượt bậc của con người liên quan đến sự biến đổi gene và bộ gene, ngày càng có nhiều bộ gene được giải trình tự hơn, cùng với những tiến bộ tương ứng trong công nghệ giải trình tự đã làm giảm chi phí xác định trình tự giảm xuống đáng kể.

Song song với sự phát triển này, các khám phá về gene góp phần giúp các căn bệnh di truyền phức tạp đã được khám phá nhanh chóng, cơ sở dữ liệu tin sinh học và phần mềm liên quan đến việc thu thập và phân tích dữ liệu di truyền đã tăng lên về số lượng, kích thước và phạm vi.

Vì vậy, tin sinh học đã là một phần không thể thiếu của di truyền học và hệ gene, từ những nghiên cứu ban đầu về ảnh hưởng của các SNP (Single Nucleotide Polymorphism) lên sự mã hóa protein, và những thách thức trong việc lắp ráp và chú thích các trình tự bộ gene. Sự phát triển về quy mô và phạm vi của cơ sở dữ liệu phải tương ứng với sự phát triển tin sinh học.

 xay dung bo co so du lieu chd 1.jpg

Hình 1: (A) Vai trò của tin sinh học với các lĩnh vực nghiên cứu khác (Verli H 2004); (B)  vị trí SNP tại một ví trí đang được khảo sát

(https://en.wikipedia.org/wiki/Single-nucleotide_polymorphism)

Các vị trí đa hình đơn nucleotide (SNP), bao gồm các biến dị di truyền, hiện là nguyên liệu thô chính trong hầu hết các nghiên cứu và cơ sở dữ liệu di truyền. Trong khi các loại biến thể khác bao gồm indels, microatellite, biến thể số bản sao và các markers epigenetics vẫn còn đang được xem xét là có thể ảnh hưởng đến các chức năng gene hay không thì phần lớn các SNP là dấu hiệu dễ xác định nhất, hữu ích nhất và được áp dụng rộng rãi trong các nghiên cứu di truyền trong thời đại hiện đại.

Ngoài ra, các SNPs còn đóng vai trò quan trọng trong nghiên cứu về di truyền tiến hóa, định loại các kiểu đơn bội (haplotype) trên hệ gen ty thể của các loai động vật hữu nhũ. Có thể thấy, việc ứng dụng các kỹ thuật Tin sinh học (bioinformatics) đóng một vai trò quan trọng trong việc tìm kiếm và phân tích các SNPs.

Cũng nhằm trong xu thế đó, nhóm nghiên cứu ứng dụng tin sinh học trong phân tích di truyền tiến hóa thuộc Khoa Công nghệ Sinh học – Trường Đại học Nguyễn Tất Thành đã tiến hành các đề tài nghiên cứu ứng dụng tin sinh học để xác định các SNPs trên hệ gene ty thể ở chó nhà để định loại haplotype một cách nhanh chóng và chính xác.

Các nghiên cứu này đã phát triển một bộ cơ sở dữ liệu trình tự vùng HV1 - CHD (Canis mtDNA HV1 database) gồm 5567 trình tự vùng HV1 trên hệ gene ty thể của 15 phân loài Canis lupus thu thập từ cơ sở dữ liệu trên GenBank, trong đó có 319 haplotype đã được xác định trong các công bố trước đó, 404 trình tự được xác định thông tin haplotype chính xác.

Khi đó, hồ sơ các đột biến (mutation profile) của mỗi trình tự cần được định loại haplotype sẽ được so sánh với hồ sơ các đột biến của một haplotype đã được xác định rõ trong cơ sở dữ liệu (CHD), nếu thấy có sự trùng khớp hoàn toàn các vị trí đột biến thì haplotype đó sẽ được chỉ định với tên tương ứng với haplotype trong cơ sỡ dữ liệu (CHD).

Ngược lại, chỉ khác nhau một vị trí đột biến thì được xem như là một haplotype mới, hồ sơ đột biến của haplotype mới này sẽ được tiếp tục so sánh với các motif thay thế của các haplogroup khác có trong cơ sở dữ liệu (CHD) được thể hiện trong Bảng 1 và đồng thời chỉ định tên của haplotype một cách chính xác.

Bảng 1 : Motif thay thế nucleotide của các haplogroup được phát hiện bởi CHD

 xay dung bo co so du lieu chd 2.jpg

CHD đã được phát triển thành một công cụ chạy trên Web giúp cho cộng đồng khoa học có thể định loại haplotype trên đoạn trình tự 582 bp của vùng HV1 một cách nhanh chóng, chính xác. CHD có thể được truy cập theo đường link http://chd.vnbiology.com. Websites này cung cấp thông tin của haplotype, trình tự haplotype và được cập nhật thường xuyên về thông tin haplotype, cung cấp tất cả dữ liệu cần thiết cho việc tải dữ liệu. Ngoài ứng dụng định loại haplotype trên chó nhà, hiện nay khoa Công nghệ Sinh học tiếp tục phát triển sử dụng công cụ này cho việc định loại haplotype trên các loài động vật hữu nhũ khác.

 xay dung bo co so du lieu chd 3.jpg

Hình 2: Giao diện websites của cơ sở dữ liệu trên CHD

Nghiên cứu đã được công bố

Quan Ke Thai, Dung Anh Chung, Hoang-Dung Tran (2017), Canis mtDNA HV1 database: a web-based tool for collecting and surveying Canis mtDNA HV1 haplotype in public database, BMC Genetics. 18(1):60

Sinh viên thực hiện đề tài

Nguyễn Văn Tú

Tác giả liên hệ

PGS. TS. Trần Hoàng Dũng, TS. Thái Kế Quân, TS. Chung Anh Dũng

Nguyễn Thành Công

Đã đọc 17815 lần
Về đầu trang
Design by Information Management Department