NGÀNH CNTT TUYỂN SINH NHIỀU CHỈ TIÊU NGÀNH CNTT, CNTT VIỆT NHẬT VÀ KHOA HỌC DỮ LIỆU

Big Data - vũ khí công nghệ hữu hiệu chống lại bệnh tật của loài người

on .

Hãy chờ xem bộ đôi IBM Watson và Big Data sẽ thay đổi thế giới như thế nào và sẽ có bao nhiêu Steve Jobs của tương lai được cứu sống. 

Chúng tôi từng nhắc tới Big Data (dữ liệu lớn) như một công cụ quản lý năng lượng hiệu quả hay một quả cầu tiên tri cho các hãng công nghệ trong việc hỗ trợ tiếp thị quảng cáo, ngày hôm nay chúng ta sẽ tiếp tục tìm hiểu một vai trò nữa của Big Data để thấy được sức mạnh của nó: Cứu tinh tương lai của Y học .

Chân dung người hùng

Trước khi nói đến chuyện Big Data có thể làm gì cho Y học thì hãy cùng tìm hiểu xem "anh chàng" Big Data có đủ tiêu chuẩn để trở thành một chỗ dựa vững chắc cho nền Y học tương lai được hay không.

Công ty máy tính IBM đã cắt nghĩa Big Data với ba chữ V: Variety, Velocity và Volume. Chữ V đầu tiên chỉ sự đa dạng, sự liên kết chằng chịt của dữ liệu với nhiều cấu trúc khác nhau, từ dữ liệu quan hệ, đến dữ liệu không cấu trúc như các văn bản thô… Chữ V thứ hai chỉ tính chất chuyển động liên tục của dòng dữ liệu rất lớn cần xử lý, khác với cách truyền thống ta thu nhận và xử lý dữ liệu theo từng mẻ (batch). Chữ V thứ ba chỉ độ lớn của dữ liệu ở mức terabyte, petabyte cả exabyte.

Big Data không những "to"...

 

Big Data có mặt trong rất nhiều hoạt động xã hội, kinh doanh, khoa học và tiềm ẩn nhiều giá trị to lớn. Nhưng dữ liệu lớn ấy đến từ đâu? Chúng đến từ rất nhiều nguồn với ba nguồn chủ đạo là:

- Các phương tiện truyền thông xã hội ví dụ như mỗi ngày trên toàn thế giới có 230 triệu đoạn tweet được đăng lên Twitter, có 2,7 tỷ ý kiến trao đổi trên mạng xã hội Facebook và số video được đưa lên Youtube mỗi ngày cần đến 86.400 giờ để xem hết.

- Các máy móc thu nhận dữ liệu, các thiết bị công nghiệp, các cảm biến, các dụng cụ giám sát, các thiết bị nghiên cứu khoa học ví dụ như máy gia tốc hạt lớn của CERN (tổ chức nghiên cứu nguyên tử châu Âu) tạo ra 40 terabyte dữ liệu mỗi giây.

- Giao dịch kinh doanh, từ số liệu giá cả sản phẩm, thanh toán, dữ liệu chế tạo và phân bố... như số sản phẩm Amazon.com bán trong quý 1 năm nay có giá trị 10 tỷ USD, như dãy các nhà hàng Domino bán pizza trên toàn nước Mỹ đạt 1 triệu khách mỗi ngày.

Big Data có khả năng giải thích được tại sao Facebook hay biết được nên quảng cáo điều gì với bạn hay vì sao những chiếc iPhone biết điều chỉnh cách đánh chữ của bạn và thậm chí Big Data còn giúp các cơ quan tình báo, an ninh xác định được liệu bạn có phải một kẻ khủng bố hay không.

Nguyên nhân chính cho những ứng dụng này của Big Data ngoài độ lớn khổng lồ còn phải nhắc đến tính phức tạp khó lường. Chẳng hạn mỗi hệ thống cụ thể như lò hạt nhân, máy bay bay phản lực… đều gồm hàng trăm nghìn bộ cảm ứng, và hoạt động của các hệ thống phải dựa vào quyết định được đưa ra theo kết quả tính toán và phân tích những tổ hợp dữ liệu của các cảm biến này.

... mà còn phức tạp hơn chúng ta nghĩ.

Sự tổ hợp các nguồn dữ liệu này là hết sức phức tạp dù kích thước của chúng không lớn. Chẳng hạn một máy bay với 100 nghìn bộ cảm biến trong một giờ bay chỉ tạo ra 3 GB dữ liệu (100.000 bộ cảm biến x 60 phút x 60 giây x 8 byte = 3GB), nhưng chính độ phức tạp của tổ hợp dữ liệu từ các bộ cảm biến này tạo ra tình huống “dữ liệu lớn mà không to”. Ngược lại trong nhiều tình huống lượng dữ liệu được sinh ra đều đặn và rất lớn về kích thước, nhưng nếu các dữ liệu này có cấu trúc đơn giản, có quy luật, thì đây lại là tình huống của “dữ liệu to mà không lớn”.

Vậy Big Data sẽ ảnh hưởng như thế nào đến nền y học của loài người? Và từ đó giúp chúng ta đạt được sức khỏe viên mãn và một cuộc sống trường tồn?

Sức mạnh thật sự

Big Data đã ghi điểm trong lĩnh vực Y học vào năm 2009 khi Google đã sử dụng dữ liệu Big Data của mình để phân tích và dự đoán xu hướng ảnh hưởng, lan truyền của dịch cúm H1N1. Dịch vụ này có tên là Google Flu Trends.

Xu hướng mà Google rút ra từ những từ khóa tìm kiếm liên quan đến dịch H1N1 đã được chứng minh là rất sát với kết quả do hai hệ thống cảnh báo cúm độc lập Sentinel GP và HealthStat đưa ra. Dữ liệu của Flu Trends được cập nhật gần như theo thời gian thực và sau đó sẽ được đối chiếu với số liệu từ những trung tâm dịch bệnh ở nhiều nơi trên thế giới.

Một cuộc khảo sát gần đây của Intel mang tên "Healthcare Innovation Barometer” cho thấy không ít người quan tâm đặc biệt đến những công nghệ tiên tiến trong lĩnh vực y học và sẵn sàng tham gia vào dịch vụ chăm sóc sức khỏe với bác sĩ riêng.

Những người này cho biết họ sẵn sàng cấy chip vào cơ thể hoặc sử dụng thiết bị wearable giúp theo dõi sức khỏe, sự vận động của cơ thể và xuyên suốt các hoạt động đó là việc tạo ra dữ liệu người dùng dài hạn và mô hình tham chiếu sức khỏe, dự đoán hầu hết các nguy cơ bệnh trong cơ thể con người.

Với khối lượng dữ liệu gia tăng mạnh mẽ, công cụ phân tích Big Data giúp việc quản lý và khai thác thông tin sao cho hiệu quả, hỗ trợ đắc lực các chuyên gia y tế trong khoa học chăm sóc sức khỏe, góp phần định hình lại phương pháp chẩn đoán mà ngành y hiện đang sử dụng.

Thay vì trải qua các pha thử nghiệm lâm sàng mất nhiều thời gian và chi phí trước khi xác định những loại thuốc mới hay phương pháp trị liệu mới có an toàn và hiệu quả hay không thì việc sử dụng máy tính mô phỏng các thí nghiệm dựa trên phân tích khối dữ liệu sản sinh liên tục sẽ thu được kết quả nhanh, chính xác hơn. Điều đó cũng đồng nghĩa các loại thuốc mới có thể được sử dụng rộng rãi và thời gian chúng đến tay bác sĩ, bệnh nhân được rút ngắn đáng kể.

Nhưng đó chưa phải tất cả, tiềm năng lớn nhất của Big Data đối với y học chính là là khả năng áp dụng vào quá trình phân tích gen, giúp phân tích trình tự bộ gen người trong một vài giờ, thay vì tới hàng tuần như trước kia.

Bộ gen người sẽ được phân tích trong thời gian ngắn với Big Data.

Y học ngày này dựa trên các kết quả thực nghiệm và số liệu, thông tin có mang tính chuyên sâu cho từng đối tượng . Trước đây, tình trạng quá tải do cùng một lúc nhiều dữ liệu gen đổ dồn vào một chỗ mặc dù vậy với sự xuất hiện của Big Data thì các nhà khoa học có thể đưa ra những giải pháp nhanh nhất, chính xác nhất và chi phí hiệu quả nhất. Những phương pháp trị liệu riêng cho từng bệnh nhân với những bệnh án khác nhau đồng nghĩa với một cuộc sống chất lượng và tốt đẹp hơn cho con người.

Theo báo cáo của các bệnh viện tại Hoa Kỳ hiện nay các bác sỹ phải đối mặt với hàng nghìn chứng rối loạn gen. Chỉ riêng trong năm 2014, hơn 580.000 người Mỹ tử vong vì ung thư . Trong khi đó, 1 trong 20 trẻ sơ sinh chào đời tại quốc gia này phải cần đến chăm sóc đặc biệt cho trẻ sơ sinh và 20% số ca tử vong trẻ sơ sinh xuất phát từ khuyết tật bẩm sinh hoặc lỗi nhiễm sắc thể.

Các trường đại học Y khoa chỉ có thể nghiên cứu một vài mẫu bởi sẽ khá phức tạp và chi phí sẽ tương đối là tốn kém khi triển khai nghiên cứu trên quy mô lớn. Ngoài ra, nhiều dữ liệu vẫn chưa được nắm rõ cũng như những cấu trúc bác sỹ vẫn chưa hoàn toàn hiểu cặn kẽ.

Big Data chính là sự bổ sung cần thiết cho nền y học hiện đại và chúng ta đang chứng kiến sự thay đổi bước ngoặt. Giải mã trình tự gen là một cách rất tốt để theo dõi một dải rộng gen để từ đó đưa ra những nhận định về nguyên nhân từng loại bệnh và tiến hành đánh giá rủi ro, phát hiện sớm hoặc dự đoán khả năng tái phát. Công nghệ này cũng có thể được sử dụng để đưa ra những phương pháp trị liệu và hướng điều trị phù hợp với từng bệnh nhân.

Một dự án mang tên The Billion Genome Project (BGP) đã được triển khai để xây dựng Big Data dựa trên quá trình khảo sát và tìm hiểu toàn bộ về dữ liệu gen của 7 tỷ người trên Trái Đất. Những thông tin về trình tự DNA và những thông tin về công nghệ sinh học đang dần thay đổi tất cả và sẽ mở ra cho chúng ta một phương pháp tiếp cận mới. Trình tự gen của những tế bào ung thư sẽ tiết lộ ra nhiều điều đằng sau thuật ngữ chúng ta đang gọi là “ung thư thận” hay “ung thư phổi”.

Giải mã gen chính là nhiệm vụ chính của Big Data.

Hàng ngàn hay hàng triệu bệnh, mỗi loại đều có những đột biến ở mức phân tử khác nhau. Mỗi khối u đều chứa những tế bào bị biến đổi chuỗi ADN khác nhau. Một nghiên cứu gần đây tiến hành ở hai bệnh nhân ung thư thận, kết quả là họ không có cùng những sai hỏng về gen di truyền.

Sự thật là, không có hai khối u nào trong cơ thể bệnh nhân có những sai hỏng giống nhau về gen. Xa hơn nữa, một cuộc nghiên cứu về trình tự gen ở tế nào ung thư vú trong năm 2014 đã không tìm thấy bất kì hai tế bào ung thư nào trong một khối u giống nhau về cấu trúc trình tự gen.

Tuy đều sử dụng dữ liệu, nhưng sử dụng dữ liệu trong hỗ trợ điều trị ung thư không đơn giản như ta sử dụng những app trên di động. Sinh học phức tạp hơn những thứ con người nghĩ ra rất nhiều. Một cuộc nghiên cứu trên 100 người bị ung thư vú vào năm 2012, đã tìm thấy đột biến trong 40 gen khác nhau trong 73 gen tổ hợp thậm chí một số người có tới 6 đột biến.

Những khối u cũng có khả năng phát triển để chống lại thuốc. Vì vậy chúng ta cần tiếp cận với những những trình tự AND của những khối u để luôn chủ động trong quá trình điều trị. Nhưng điều chúng ta vẫn còn hạn chế là với nhiều đột biến, ta vẫn chưa có thuốc thích hợp để điều trị.

Trong tháng 1/2015, công ty chăm sóc sức khỏe toàn cầu Roche, công ty dược phẩm mạnh nhất về nghiên cứu ung thư trên thế giới có trụ sở tại Thụy Sỹ, đã chi đậm hơn 1 tỷ USD để mua một nửa số cổ phần của công ty nhỏ bé có tên là Foundation Medicine.

Foundation Medicine, một trong những cái tên đi đầu trong việc ứng dụng Big Data vào điều trị ung thư.

Foundation Medicine không đầu tư nghiên cứu bất kì loại thuốc nào hoặc thiết bị y tế nào nhưng giá trị của công ty này nằm ở thông tin mà nó đang nắm giữ. Roche muốn tiếp cận với cơ sở dữ liệu nằm trong Big Data của Foundation Medicine dữ liệu này bao gồm trình tự ADN của những khối u trên 35 nghìn bệnh nhân ung thư, kèm theo là thông tin về những loại thuốc họ đã được sử dụng và hiệu quả của nó trên những bệnh nhân này.

Vậy thương vụ tỷ đô này của Roche đem lại lợi ích gì? Điều trị ung thư kiểu “truyền thống” rất thiếu thông tin. Ung thư được phân loại và điều trị dựa trên bộ phận phát sinh ung thư, hình dạng tế bào như thế nào và mức độ di căn, dẫn đến những chẩn đoán bạn hay nghe như “ung thư giai đoạn 2”… Những phân loại này trở nên chi tiết hơn trong một vài năm trở lại đây, nhưng nó vẫn còn quá chung chung.

Điều này không phải quá tệ, nhưng nó làm lu mờ đi bản chất thật sự. Đối với phương pháp chữa bệnh ung thư kiểu truyền thống này, rất khó khăn cho bác sĩ để chọn thuốc điều trị tốt nhất cho bệnh nhân. Theo một ước tính của Roche thì trung bình một tháng thế giới phải chi 39 tỷ USD tiền thuốc ung thư nhưng gần như không hiệu quả.

Trước đó, vào cuối năm 2014 Roche cũng đã mua lại công ty Bina Technology chuyên về Big Data và tổng hợp dữ liệu trình tự gen với giá không tiết lộ. Narges Bani Asadi - Người sáng lập và CEO của Bina - cho biết: ”Việc được Rohce quan tâm và mua lại khiến chúng tôi tự tin hơn với những gì mình đang làm. Đây cũng là một trong những dấu chỉ cho thấy thông tin thu thập và dữ liệu khoa học sẽ đóng góp vai trò lớn như thế nào trong việc phát minh ra các loại thuốc mới trong thời gian sắp tới.”

Sau khi hồ sơ của bệnh nhân ung thư được đưa tới Foundation Medicine, công ty sẽ kiểm tra trong khoảng 300 những đột biến đã biết và đóng vai trò trong quá trình hình thành ung thư, những mẫu mô thường lấy ở vú, xương hay phổi. Những thông tin này sẽ giúp ta xác định chính xác loại đột biến để có thể điều trị với thuốc phù hợp.

Michael Pellini, chủ tịch Foundation Medicine, phát biểu tại Hội nghị Personalized Medicine World Conference (PMWC 2015) diễn ra tại Anh vào tháng 1 vừa qua: "Với Big Data, chúng tôi đang kiểm tra trên một bộ phận dân số. Trong tương lai, chúng ta sẽ không nói về một bệnh nhân ung thư vú giai đoạn X nữa, mà chúng ta sẽ phân loại lại ung thư theo mức độ biến đổi của phân tử.”

Một trong 35 nghìn người có dữ liệu tại Foundation Medicine là Corey Wood. Cô mới 22 tuổi và bị chẩn đoán ung thư chỉ một vài tuần sau khi tốt nghiệp, cô đang ở giai đoạn 4 hay còn được gọi là ung thư phổi không tiểu bào và đã bị di căn lên não và mắt.

Corey Wood, cô gái chiến thắng với căn bệnh ung thư phổi nhờ có Big Data.

Mẫu sinh tiết của cô được gửi tới Foundation Medicine và các chuyên gia tại đây đã phát hiện ra một lỗ hổng trên gen ROS-1, vốn có thể chữa trị bằng cách sử dụng thuốc Xalcori, thuốc này giúp bất hoạt tế bào có những gene bị biến đổi. Ít hơn 2% bệnh nhân ung thư phổi có biến đổi này, vì vậy bác sĩ sẽ không bao giờ cho cô dung thuốc này nếu không có những thông tin về đột biến gen. Corey Wood bắt đầu sử dụng thuốc trong 3 tháng và bệnh ung thư của cô gần như biến mất.

Tháng 2 vừa rồi, các bác sỹ tại Foundation Medicine thông báo là cô đã chính thức hết bệnh. Corey Wood và gia đình đã không giấu nổi niềm vui cùng những giọt nước mắt khi trả lời phỏng vấn của tờ The Guardian:“Tôi đang đánh bại căn bệnh ung thư phổi, xin cám ơn các bác sỹ tại Foundation Medicine và những người đã nghiên cứu ra khái niệm Big Data.”

Nhiều nước trên thế giới hiện đã và đang thực hiện số hóa hệ thống hồ sơ y tế điện tử cấp quốc gia và kho dữ liệu này góp phần cải thiện sự an toàn của bệnh nhân, cập nhật phương pháp điều trị mới cũng như giúp dịch vụ chăm sóc sức khỏe tiếp cận toàn diện hồ sơ bệnh án của mỗi bệnh nhân, hỗ trợ việc chẩn đoán bệnh và xây dựng phương pháp điều trị riêng cho mỗi cá nhân dựa trên thông tin di truyền và sinh lý học.

Mảnh ghép hoàn hảo

Steve Jobs , bị ung thư tuyến tụy, là một trong những bệnh nhân được tiếp cận dữ liệu Big Data để theo dõi hiệu quả điều trị các phác đồ điều trị ung thư và việc thay đổi liên tục phác đồ giúp duy trì sự sống cho ông thêm một thời gian tương đối.

Siêu máy tính IBM Watson được coi như là những nét cơ bản của bức tranh toàn cảnh nền Y học hiện đại trong tương lai và Big Data chính là miếng ghép hoàn hảo để hoàn thành bức trang này.

Nguồn: http://www.baomoi.com/Big-Data-vu-khi-cong-nghe-huu-hieu-chong-lai-benh-tat-cua-loai-nguoi/82/16960871.epi