Google vừa công bố DeepSomatic, một công cụ AI có khả năng nhận diện chính xác hơn các biến thể đột biến liên quan đến ung thư trong chuỗi gen của khối u.
Ung thư khởi phát khi các cơ chế kiểm soát quá trình phân chia tế bào bị lỗi. Việc xác định các đột biến gen cụ thể thúc đẩy sự phát triển của khối u đóng vai trò then chốt trong việc xây dựng phác đồ điều trị hiệu quả. Hiện nay, bác sĩ thường tiến hành giải trình tự gen các tế bào khối u từ mẫu sinh thiết để xác định phương pháp điều trị nhắm mục tiêu vào cách ung thư phát triển và lan rộng.
Được công bố trên tạp chí Nature Biotechnology, nghiên cứu này giới thiệu một công cụ sử dụng mạng nơ-ron tích chập (convolutional neural networks) nhằm nhận diện các biến thể gen trong tế bào khối u với độ chính xác vượt trội so với các phương pháp hiện tại. Google đã mở mã nguồn DeepSomatic cùng bộ dữ liệu đào tạo chất lượng cao được xây dựng dành riêng cho công cụ này.
Thách thức từ các biến thể somatic
Di truyền học ung thư rất phức tạp. Mặc dù giải trình tự bộ gen giúp phát hiện các biến thể gen liên quan đến ung thư, việc phân biệt đâu là biến thể thực sự, đâu là lỗi do quá trình giải trình tự vẫn là bài toán khó, và đây chính là điểm mà AI có thể hỗ trợ rất hiệu quả. Phần lớn các loại ung thư phát triển từ các biến thể ‘somatic’ – những đột biến phát sinh sau khi sinh, chứ không phải từ các biến thể ‘germline’ di truyền từ bố mẹ.
Biến thể somatic xuất hiện khi các yếu tố môi trường như tia UV gây hại DNA, hoặc do lỗi ngẫu nhiên trong quá trình nhân đôi DNA. Khi các biến thể này làm thay đổi chức năng bình thường của tế bào, chúng có thể gây ra sự tăng sinh không kiểm soát, thúc đẩy quá trình phát triển và tiến triển ung thư.
Việc phát hiện biến thể somatic còn khó hơn các biến thể di truyền bởi chúng thường có tần suất rất thấp trong tế bào khối u, đôi khi thấp hơn cả tỷ lệ lỗi trong quá trình giải trình tự.
DeepSomatic hoạt động như thế nào?
Trong môi trường lâm sàng, các nhà khoa học sẽ giải trình tự đồng thời cả tế bào khối u từ mẫu sinh thiết và tế bào bình thường từ cùng bệnh nhân. DeepSomatic phát hiện sự khác biệt, nhận diện các biến thể chỉ có ở tế bào khối u không phải do di truyền. Những biến thể này hé lộ nguyên nhân thúc đẩy sự phát triển của khối u.
Mô hình sẽ chuyển dữ liệu giải trình tự gen thô từ cả mẫu khối u và mẫu bình thường thành các hình ảnh thể hiện nhiều điểm dữ liệu, bao gồm thông tin giải trình tự và vị trí của chúng trên nhiễm sắc thể. Một mạng nơ-ron tích chập sẽ phân tích những hình ảnh này để phân biệt bộ gen tham chiếu chuẩn, các biến thể di truyền bình thường của cá nhân, và các biến thể somatic gây ung thư đồng thời loại bỏ các lỗi phát sinh từ quá trình giải trình tự. Kết quả là một danh sách các đột biến liên quan đến ung thư.
DeepSomatic còn có thể vận hành ở chế độ ‘tumour-only’ khi không có mẫu tế bào bình thường, điều thường xảy ra với các bệnh ung thư máu như bạch cầu. Điều này giúp công cụ dễ dàng ứng dụng trong đa dạng tình huống nghiên cứu và lâm sàng.
Huấn luyện AI chính xác hơn cho nghiên cứu ung thư
Để tạo ra một mô hình AI chính xác, dữ liệu đào tạo phải đạt chất lượng cao. Google cùng các đối tác tại Viện Gen học UC Santa Cruz và Viện Ung thư Quốc gia đã xây dựng bộ dữ liệu chuẩn mang tên CASTLE, với mẫu tế bào khối u và tế bào bình thường từ bốn bệnh nhân ung thư vú và hai bệnh nhân ung thư phổi.
Các mẫu này được phân tích trên ba nền tảng giải trình tự hàng đầu, tạo thành một bộ dữ liệu chuẩn duy nhất và chính xác thông qua việc tổng hợp kết quả và loại bỏ lỗi đặc thù từng nền tảng. Dữ liệu cho thấy cùng một loại ung thư có thể mang dấu ấn đột biến rất khác biệt, thông tin này giúp dự đoán khả năng đáp ứng điều trị của bệnh nhân.
Mô hình DeepSomatic cho kết quả tốt hơn so với các phương pháp hiện có trên cả ba nền tảng giải trình tự lớn. Công cụ này đặc biệt xuất sắc trong việc phát hiện các loại đột biến phức tạp như chèn thêm hoặc xóa đoạn DNA (được gọi là Indels). Với các biến thể này, DeepSomatic đạt điểm F1-score lên tới 90% trên dữ liệu Illumina, so với 80% của phương pháp tốt thứ hai. Trên dữ liệu từ Pacific Biosciences, kết quả thậm chí còn ấn tượng hơn khi DeepSomatic đạt trên 80%, trong khi công cụ kế tiếp chỉ chưa đến 50%.
AI cũng thể hiện hiệu suất mạnh mẽ với các mẫu phân tích khó. Các thử nghiệm bao gồm mẫu ung thư vú bảo quản theo phương pháp formalin-fixed-paraffin-embedded (FFPE), một kỹ thuật phổ biến nhưng có thể gây hư hại DNA và làm phức tạp quá trình phân tích. Ngoài ra, DeepSomatic còn được kiểm tra với dữ liệu giải trình tự toàn bộ exome (WES) – phương pháp tiết kiệm chi phí chỉ giải trình tự 1% bộ gen Token hoá protein. Trong cả hai trường hợp, DeepSomatic vẫn vượt trội so với các công cụ khác, chứng minh khả năng ứng dụng trên những mẫu chất lượng thấp hoặc mẫu lưu trữ từ trước.
Công cụ AI dành cho mọi loại ung thư
Công cụ AI này đã chứng minh khả năng áp dụng kiến thức học được vào các loại ung thư mới mà nó chưa từng được huấn luyện trước đó. Khi phân tích mẫu glioblastoma – một dạng ung thư não rất ác tính, DeepSomatic đã thành công trong việc xác định các biến thể đột biến hiếm hoi nhưng đóng vai trò quyết định trong bệnh lý. Trong một dự án hợp tác với Bệnh viện Nhi đồng Mercy ở Kansas City, công cụ đã phân tích tám mẫu bạch cầu cấp trẻ em, phát hiện các biến thể đã biết đồng thời bổ sung thêm 10 biến thể mới, dù chỉ sử dụng mẫu ‘tumour-only’.
Google kỳ vọng các phòng nghiên cứu và bác sĩ sẽ ứng dụng DeepSomatic để hiểu rõ hơn về đặc tính riêng biệt của từng khối u. Nhờ phát hiện các biến thể ung thư đã biết, công cụ giúp định hướng lựa chọn phác đồ hiện có. Đồng thời, việc phát hiện những biến thể mới mở ra cơ hội phát triển các liệu pháp điều trị đột phá. Mục tiêu cuối cùng là thúc đẩy y học chính xác và mang đến phương pháp điều trị hiệu quả hơn cho bệnh nhân.
Nguồn : https://www.artificialintelligence-news.com/