Lã Kiều Ngọc Thăng, sinh viên ĐH Bách khoa Hà Nội, sáng tạo công cụ AI LViTES tự động nhận diện và phân vùng tổn thương nội soi, đạt giải nhất nghiên cứu khoa học.
- Sinh viên Bách khoa phát triển AI hỗ trợ bác sĩ nội soi
- Ở ghép với người lạ khác giới: Lựa chọn mới và những lưu ý an toàn
- Sân pickleball bất ngờ đổ sập vì giông, chính quyền xác nhận xây dựng trái phép
Công cụ AI tiên tiến cho y học
Lã Kiều Ngọc Thăng, sinh viên năm thứ tư ngành Truyền thông số và Kỹ thuật đa phương tiện tại Đại học Bách khoa Hà Nội, đã phát triển LViTES (Leveraging Vision and Text for Endoscopic Segmentation). Đây là một mô hình trí tuệ nhân tạo (AI) có khả năng phân tích hình ảnh nội soi, tự động khoanh vùng các tổn thương như polyp, viêm loét, hoặc dấu hiệu tiền ung thư. Công cụ này không chỉ dừng ở việc nhận diện hình ảnh mà còn kết hợp bệnh án và ghi chú từ bác sĩ để nâng cao độ chính xác chẩn đoán.
LViTES đã được thử nghiệm thành công trên bộ dữ liệu Kvasir-SEG, một nguồn dữ liệu khoa học mở về các bệnh lý polyp trong hệ tiêu hóa. Kết quả cho thấy mô hình vượt trội về hiệu suất phân vùng so với các phương pháp truyền thống, mang lại tiềm năng hỗ trợ bác sĩ nội soi trong việc phát hiện sớm và chính xác các tổn thương.
Hành trình nghiên cứu đầy thách thức
Hành trình phát triển LViTES bắt đầu từ tháng 5/2024, khi Thăng thực hiện đồ án dưới sự hướng dẫn của PGS.TS Trần Thị Thanh Hải, giảng viên Trường Điện – Điện tử. Đề tài được chia thành ba giai đoạn chính:
- Thu thập và xử lý dữ liệu: Thăng sử dụng bộ dữ liệu Kvasir-SEG và hình ảnh nội soi ung thư dạ dày, thực quản để xây dựng nền tảng dữ liệu.
- Xây dựng và huấn luyện mô hình: Mô hình sử dụng mạng nơ-ron tích chập (CNN) EfficientNet để trích xuất đặc trưng hình ảnh, kết hợp với kiến trúc Transformer để tích hợp thông tin hình ảnh và văn bản.
- Thử nghiệm thực tế: Mô hình được đánh giá trên dữ liệu thực, đạt độ chính xác cao nhờ các chỉ số như IoU và Dice coefficient, với sự hỗ trợ từ các chuyên gia y tế.
Thăng thực hiện nghiên cứu độc lập, từ tìm hiểu lý thuyết đến triển khai kỹ thuật. Một trong những thách thức lớn nhất là thiếu dữ liệu văn bản mô tả đi kèm ảnh nội soi. Để giải quyết, nam sinh đã sáng tạo một module sinh văn bản tự động, chuyển đổi nhãn hình ảnh thành các mô tả chi tiết, giúp mô hình AI học hiệu quả hơn.
Tinh thần tự học và sáng tạo
Thăng chia sẻ rằng nguồn cảm hứng cho LViTES đến từ những khó khăn thực tế của bác sĩ nội soi, khi phải phân tích hàng giờ hình ảnh để phát hiện tổn thương mà thiếu công cụ hỗ trợ nhanh chóng. Với nền tảng toán học vững chắc và khả năng tự học, Thăng đã kiên trì vượt qua các vấn đề kỹ thuật và học thuật trong quá trình nghiên cứu.
PGS.TS Trần Thị Thanh Hải đánh giá cao sự kiên định và sáng tạo của Thăng. “Em ấy có nền tảng kỹ thuật vững vàng và lựa chọn hướng đi mới trong lĩnh vực mô hình thị giác – ngôn ngữ (Visual Language Models – VLM). Đây là một nỗ lực rất đáng ghi nhận,” cô Hải nhận xét.
Tầm nhìn cho tương lai
Hiện tại, Thăng đang phát triển phiên bản nâng cấp của LViTES để tích hợp vào các hệ thống y tế thực tế, trở thành trợ thủ đắc lực cho bác sĩ nội soi. Ngoài ra, nam sinh còn mở rộng nghiên cứu sang các lĩnh vực chẩn đoán hình ảnh khác như X-quang và CT scan, với mục tiêu ứng dụng AI sâu rộng hơn trong y học.
Thăng nhấn mạnh rằng tinh thần kiên trì và khả năng tự học là yếu tố then chốt để thành công trong nghiên cứu khoa học. Với giải nhất cuộc thi sinh viên nghiên cứu khoa học của Đại học Bách khoa Hà Nội, LViTES không chỉ là thành tựu cá nhân mà còn mở ra tiềm năng lớn cho ứng dụng AI trong y tế Việt Nam.
Theo: VnExpress