Dự án xây dựng cơ sở dữ liệu với quy mô hơn 1.000 hệ gene được giải trình tự, hơn 40 triệu biến thể di truyền được phát hiện. Nghiên cứu không chỉ mở ra bộ cơ sở dữ liệu cộng đồng quý giá, mà còn tạo tiền đề cho sự phát triển của nghiên cứu y sinh và y học chính xác, góp phần cảnh báo điều trị sớm đến từng người Việt trong tương lai.
Quy trình tiên tiến hàng đầu thế giới
Đây là bộ dữ liệu toàn hệ gene người Việt đầu tiên, đảm bảo tính đại diện và phổ quát cho quần thể, phù hợp với phân bố dân cư về địa lý (miền Bắc: 37%, miền Trung: 22%, miền Nam: 41%) và giới tính (cân bằng tỷ lệ nam nữ). Bộ dữ liệu gene cũng có đầy đủ chú giải về chức năng sinh học cũng như nguy cơ bệnh lý.
Nghiên cứu của VinBigData hứa hẹn tạo tiền đề phát triển nền y sinh và y học Việt Nam. |
Dự án "Xây dựng cơ sở dữ liệu biến dị di truyền cho quần thể người Việt" được VinBigData khởi động từ tháng 12/2018, với sự tham gia của hơn 40 nhà khoa học gồm nhiều chuyên gia giàu kinh nghiệm thuộc VinBigData, chuyên gia tư vấn cao cấp từ những đơn vị nghiên cứu hàng đầu như Đại học Harvard, Đại học Chicago, Trung tâm Ung thư MD Anderson,... cùng hàng trăm chuyên gia, tình nguyện viên tại Việt Nam và thế giới.
Trong 3 năm, nhóm nghiên cứu đã giải trình tự toàn bộ hệ gene của hơn 1.000 người trưởng thành khỏe mạnh (35-55 tuổi) không có quan hệ huyết thống; thu thập đủ thông tin kiểu hình và nhân khẩu học; phân tích một phần hệ gene của hơn 4.000 trường hợp liên quan đến các bệnh lý phổ biến và khả năng đáp ứng thuốc. Kết quả phát hiện hơn 40 triệu biến thể di truyền, trong đó có gần 2 triệu biến thể gene phổ biến đặc trưng cho quần thể người Việt.
Quy trình phân tích dữ liệu và chú giải biến thể gene của VinBigData được đánh giá tiên tiến hàng đầu thế giới. Công đoạn xử lý mẫu được triển khai tại phòng thí nghiệm đạt chuẩn quốc tế ISO 15189 (tiêu chuẩn quy định các yêu cầu về năng lực và chất lượng với các phòng xét nghiệm y tế) thuộc Bệnh viện Đa khoa Quốc tế Vinmec.
Công đoạn xử lý mẫu được triển khai tại phòng thí nghiệm đạt chuẩn quốc tế ISO 15189 thuộc Bệnh viện Đa khoa Quốc tế Vinmec. |
Khối lượng dữ liệu được xử lý bằng công nghệ hiện đại của Google, Illumina - hãng công nghệ hàng đầu thế giới về giải trình tự gene, NVIDIA - tập đoàn công nghệ đa quốc gia của Mỹ. Bên cạnh đó, VinBigData cũng hợp tác khoảng 20 tổ chức nghiên cứu, bệnh viện hàng đầu trong và ngoài nước như Đại học John Hopkins (Mỹ), The GoldenHelix Foundation (Anh), Đại học Y Hà Nội, Bệnh viện Trung ương Quân đội 108...
Thúc đẩy y học phát triển
Giáo sư Vũ Hà Văn, Giám đốc Khoa học VinBigData, cho biết: "Phần lớn nghiên cứu và thực hành lâm sàng tại Việt Nam đang dựa vào cơ sở dữ liệu di truyền của các quần thể khác trên thế giới. Điều này ảnh hưởng đến kết quả của công bố khoa học, cũng như chất lượng khám chữa bệnh cho người Việt".
Giáo sư Vũ Hà Văn, Giám đốc Khoa học VinBigData, khẳng định tầm quan trọng của cơ sở dữ liệu biến dị di truyền cho quần thể người Việt. |
Với tổng mức đầu tư hơn 4,5 triệu USD, dự án giải mã gene của Vingroup được đánh giá có quy mô lớn nhất Việt Nam tính đến hiện tại. VinBigData cũng trở thành đơn vị tiên phong tại Việt Nam tiến hành giải trình tự toàn bộ hệ gene người Việt, đặt mục tiêu mở ra hướng đi mới, góp phần phát triển y học nước nhà.
GS.TS Tạ Thành Văn, Chủ tịch Hội đồng Đại học Y Hà Nội, đánh giá: "Hiện nay, các bác sĩ chủ yếu dựa vào lâm sàng, xét nghiệm sinh hóa hoặc tiền sử bệnh để thăm khám và ra quyết định điều trị. Dữ liệu hệ gene hứa hẹn tăng tính chính xác và hiệu quả trong chẩn đoán, điều trị bệnh. Trên phạm vi toàn dân, cơ sở dữ liệu hệ gene người Việt được kỳ vọng thúc đẩy sự phát triển của y học dự phòng và thực hành y học chính xác, góp phần cải thiện sức khỏe cộng đồng".
Sau khi hoàn tất, một phần dữ liệu của dự án được mở để cộng đồng truy cập thông qua hệ thống quản lý, phân tích và chia sẻ dữ liệu y sinh MASH Portal. Người dùng có thể tra cứu để tham khảo, phục vụ các nghiên cứu y sinh. Hệ thống cũng thử nghiệm một số công cụ phân tích tốc độ cao (30-60 phút) cho dữ liệu toàn hệ gene người.
MASH Portal là cổng dữ liệu mở, hỗ trợ cộng đồng tra cứu và phân tích thử nghiệm dữ liệu toàn hệ gene của người Việt. Ảnh chụp từ website. |
Kết quả dự án sẽ được VinBigData ứng dụng trực tiếp vào các sản phẩm giải mã gene dành riêng cho người Việt, với độ chính xác và tốc độ vượt trội. Nghiên cứu hứa hẹn tạo tiền đề hỗ trợ khám phá đặc điểm sinh lý, tâm lý của cá nhân, đồng thời dự đoán nguy cơ mắc bệnh phổ biến, bệnh di truyền lặn, đánh giá mức độ đáp ứng thuốc trong tương lai.
Cổng dữ liệu MASH hiện lưu trữ hơn 2.500 TB dữ liệu gene người Việt đã được chú giải, gồm dữ liệu nhân khẩu học và cận lâm sàng, phù hợp tiêu chuẩn của Viện Y tế Quốc gia Hoa Kỳ (NIH). Trên thế giới, chỉ một số quốc gia phát triển như Mỹ, Anh, Pháp, Nhật Bản, Trung Quốc,... mới đủ tiềm lực giải mã trọn bộ gene người trên quy mô lớn. Việc đẩy mạnh khai phá hệ gene của các quần thể được kỳ vọng góp phần thiết lập những nền tảng cơ bản về nhân chủng học, bệnh lý học, thúc đẩy y học dự phòng và điều trị cá thể hóa. Độc giả truy cập hệ thống MASH tại đây.