Một buổi sáng, trong cuộc họp ở bệnh viện tuyến huyện, bác sĩ trưởng hỏi: “Nếu chúng ta có thể tự huấn luyện một AI giúp đọc X-quang mà không cần trả hàng trăm nghìn đô la mỗi năm, các bạn có làm không?” Cả phòng im lặng vài giây, trước khi một bác sĩ trẻ thốt lên: “Thật à? Có thật là có thể không?”
Thật đấy. Và Google vừa khiến điều đó khả thi.
Vì sao động thái của Google khác biệt?
Trước đây, AI y tế thường bị khóa trong các API đắt đỏ, chạy trên server của nhà cung cấp, với quy tắc ngặt nghèo về dữ liệu. Với MedGemma 27B, MedGemma 4B và MedSiglip, Google đã phá vỡ quy luật này: cung cấp mã nguồn mở và cho phép tải xuống, sửa đổi và vận hành tại chỗ.
Điều này giải quyết ba nỗi lo lớn của các bệnh viện:
- Dữ liệu bệnh nhân không rời khỏi hệ thống nội bộ.
- Có thể tùy chỉnh theo nhu cầu đặc thù của từng bệnh viện.
- Chi phí vận hành giảm đáng kể.
Hình dung một bệnh viện nhỏ ở miền núi có thể chạy MedGemma trên một server khiêm tốn, huấn luyện lại với dữ liệu của mình và phục vụ hàng trăm bệnh nhân mỗi ngày – đó không còn là viễn cảnh xa vời.
Khả năng kỹ thuật đáng chú ý
MedGemma 27B là một mô hình đa phương thức: vừa đọc văn bản y tế, vừa hiểu hình ảnh y tế – từ X-quang, slide bệnh lý đến hồ sơ bệnh án kéo dài nhiều năm. Trên bài kiểm tra MEDQA, nó đạt tới 87,7%, tiệm cận các mô hình khổng lồ nhưng chỉ tốn ~1/10 chi phí vận hành.
Người anh em nhỏ hơn, MedGemma 4B, khiêm tốn về kích thước nhưng đạt 64,4%, và khi các bác sĩ X-quang Mỹ kiểm tra, họ thấy nó 81% đủ chính xác để hướng dẫn chăm sóc bệnh nhân thực sự.
MedSiglip chỉ nặng 400 triệu tham số nhưng lại là một “nhà máy điện lông vũ” chuyên sâu vào hình ảnh y tế. Nó có thể phát hiện các mẫu tinh vi trên X-quang, da liễu, nhãn khoa… và thậm chí còn nối được hình ảnh với các văn bản y tế tương ứng – một khả năng tinh tế mà nhiều AI đa năng chưa làm được.
So với các mô hình lớn khác, ba mô hình này vừa nhẹ, vừa chính xác, vừa dễ tiếp cận hơn nhiều.
Ứng dụng thực tiễn & phản hồi từ chuyên gia
DeepHealth (Massachusetts) đã thử nghiệm MedSiglip để phân tích X-quang. Họ nhận thấy nó hoạt động như một mạng lưới an toàn, phát hiện những điểm bất thường mà bác sĩ bận rộn dễ bỏ qua.
Tại Chang Gung Hospital (Đài Loan), MedGemma chứng tỏ khả năng làm việc với tiếng Trung y học, trả lời chính xác câu hỏi nhân viên y tế.
Ở Ấn Độ, Touch Health lại nhấn mạnh rằng MedGemma ít “ảo giác” hơn so với các chatbot y tế khác. Đó là sự khác biệt quan trọng giữa một chatbot nghe có vẻ y tế và một AI thực sự hiểu bối cảnh lâm sàng.
Cơ hội & thách thức
Việc Google mở nguồn không chỉ là “hào phóng”, mà còn mang tính chiến lược: dân chủ hóa AI y tế.
Giờ đây, các bệnh viện nhỏ, các trường y, các nhà nghiên cứu ở các nước đang phát triển đều có thể tiếp cận công nghệ tiên tiến. Các phiên bản nhẹ của mô hình thậm chí có thể chạy trên GPU đơn hoặc thiết bị di động, mở đường cho những ứng dụng tại điểm chăm sóc ở nơi thiếu hạ tầng.
Nhưng, như mình từng kỳ vọng (sai lầm) rằng AI sẽ “thay thế” con người hoàn toàn – thực tế, nó không thể. Các mô hình này vẫn cần giám sát, xác minh, và phán đoán của bác sĩ. Trong các ca hiếm gặp, những kịch bản bất thường, AI vẫn có thể mắc lỗi. Và đó là lúc chuyên môn, kinh nghiệm, trách nhiệm đạo đức của con người không thể thiếu.
Gợi mở
Điều thú vị nhất ở đây không chỉ là khả năng tức thì, mà là những gì nó cho phép: sinh viên y học tập với AI y tế thực thụ, các bệnh viện nông thôn tiếp cận công nghệ đỉnh cao, nghiên cứu địa phương được đẩy nhanh…
Đây không chỉ là công nghệ, mà là lời mời gọi cộng đồng y tế cùng đồng sáng tạo. Câu hỏi là: Liệu chúng ta đã sẵn sàng trở thành đồng nghiệp của AI – không chỉ là người dùng?
Bởi càng phổ biến, càng có nguy cơ bị lạm dụng, và khi đó, chúng ta cần không chỉ kỹ thuật mà cả khung pháp lý và đạo đức rõ ràng.
“AI không thay thế bác sĩ. Nhưng bác sĩ nào biết dùng AI sẽ thay thế bác sĩ không biết dùng AI.”
Bạn đã sẵn sàng để cộng tác với đồng nghiệp mới này chưa?