อุปสรรคสำคัญในการสร้างปัญญาประดิษฐ์เพื่อการแพทย์ในประเทศไทย

กว่าหนึ่งปีแล้วที่บริษัทเพอเซ็ปทราทำงานอย่างมุ่งมั่นที่จะทำให้ปัญญาประดิษฐ์สามารถตรวจโรคจากภาพถ่ายทางการแพทย์ได้ในโลกจริง ความฝันของเราคือการทำให้ AI สามารถตรวจพบความผิดปกติในรูปถ่ายเอกซเรย์ เพื่อคัดกรองโรคที่ฆ่าชีวิตคนไทยได้ตั้งแต่ในระยะเริ่มต้น เช่น มะเร็งปอด ปอดติดเชื้อ ถุงลมโป่งพอง และวัณโรค เพื่อช่วยเพิ่มโอกาสการรักษาให้หายได้ และเราอยากเห็นทุกโรงพยาบาลในประเทศไทยได้ใช้ประโยชน์จากเอไอโดยทั่วกัน
แม้ว่าการนำเอาปัญญาประดิษฐ์มาตรวจภาพถ่ายทางการแพทย์ ไม่ใช่เรื่องใหม่แล้วในสังคมของนักวิชาการ มีหลายทีมในโลกนี้ที่อ้างว่า AI สามารถตรวจเช็คโรคได้แบบมีความแม่นยำเทียบเท่ารังสีแพทย์ ในฐานะคนทำงานด้านเทคโนโลยี เราก็เกิดความสงสัยว่า ทำไมเอไอเหล่านี้จึงไม่อยู่ในโรงพยาบาลทุกแห่ง วันนี้ทีมเพอเซ็ปทราอยากจะมาเล่า 3 อุปสรรคหลักที่เราพบเจอในเส้นทางของการนำปัญญาประดิษฐ์ออกสู่มวลชน

AI ที่สามารถตรวจภาพถ่ายเอกซเรย์ในต่างประเทศได้ ไม่ได้หมายความว่าจะสามารถตรวจภาพของคนไทยได้

ปัญหาใหญ่ในการสร้างปัญญาประดิษฐ์คือปัญหา “Overfitting” ถ้าจะอธิบายคำนี้ง่ายๆ ให้คนที่ไม่ได้มีพื้นฐานด้านเทคนิคเข้าใจ มันคือปัญหาที่คอมพิวเตอร์รู้จักภาพ แต่ไม่ได้เข้าใจภาพจริงๆ เช่น คอมพิวเตอร์อาจจะเคยเห็นภาพปอดเอกซเรย์ที่มีก้อนเนื้ออยู่ตรงปอดด้านขวา และมันสามารถจำภาพนั้นได้และเมื่อเจอภาพนั้นอีกครั้งก็อาจจะบอกได้ว่ามีก้อนเนื้ออยู่ แต่มันไม่ได้เข้าใจว่า “ก้อนเนื้อ” หน้าตาเป็นอย่างไร พอเราเอาภาพเอกซเรย์ที่มีก้อนเนื้ออยู่ตรงปอดด้านซ้าย คอมพิวเตอร์กลับไม่สามารถบอกได้ว่ามีก้อนเนื้ออยู่ เพราะที่ผ่านมามันท่องจำ แต่ไม่ได้เข้าใจจริงๆ ปัญญาประดิษฐ์แม้จะฉลาดมากก็จริง แต่ในขณะเดียวกันก็มีความไม่เฉลียว และสามารถถูกหลอกได้ง่ายมาก ภาพจากโรงพยาบาลไทยที่ถ่ายจากคนไข้ไทย ไม่ได้เพียงแต่มีสรีระที่แตกต่างจากภาพจากโรงพยาบาลต่างชาติ แต่เครื่องไม้ เครื่องมือในการถ่าย วิธีการตั้งค่าความเข้มของเอกซเรย์ ความสว่าง ความคมชัด จนกระทั่งสถิติของการเกิดโรค ล้วนแล้วแต่มีผลทำให้ภาพที่ออกมาแตกต่างกัน ในสายตามนุษย์ภาพเหล่านี้อาจจะดูเหมือนกันก็จริง แต่ในสายตาของคอมพิวเตอร์ภาพกลับต่างกันมากมาย แม้แต่ภาพจากคนละโรงพยาบาล ก็อาจจะต่างถึงขั้นทำให้ปัญญาประดิษฐ์ทำนายผิดพลาดได้

เราจะทำการแก้ไขปัญหา overfitting ได้อย่างไร?

วิธีแรก คือการรวบรวมภาพที่มีความหลากหลาย ทั้งมืด ทั้งสว่าง ทั้งคมชัด ทั้งมัว เพื่อนำมาเทรนโมเดลให้เก่งจริง นั่นเป็นเหตุผลว่าทำไมเพอเซ็ปทราจึงใช้เวลาและความร่วมมือกับโรงพยาบาล เพื่อรวบรวมภาพกว่า 2.5 ล้านภาพทั่วโลก มาสอนโมเดลให้รู้จักภาพปอดที่มีคุณลักษณะที่หลากหลาย

วิธีที่สอง ในการเทรนโมเดล เราใช้เทคนิคต่างๆที่บังคับให้โมเดลต้องเข้าใจภาพ เช่นการบิดภาพ การกลับภาพ การเพิ่มความเบลอของภาพ รวมทั้งปรับกระบวนการเทรนสร้างเป้าหมายใหม่เพื่อบอกโมเดลว่าไม่ต้องจำทุกภาพ รู้ไปหมดทุกภาพก็ได้ แต่ขอให้รู้จริงว่าคุณลักษณะใดบ่งบอกว่าปอดเป็นโรค

วิธีที่สาม เราใช้วิธีการทางคณิตศาสตร์อีกหลายวิธีที่ปรับภาพที่ไม่ใกล้เคียงกัน ให้กลายเป็นภาพที่มีสถิติคล้ายคลึงกันก่อนจะนำไปเข้าโมเดล คือการลดความหลากหลายของภาพที่ใช้สอนโมเดล ทำให้สามารถเข้าใจคุณลักษณะสำคัญได้เร็วขึ้น

ความไม่แน่นอนของรายงานการแพทย์ที่นำมาสอนโมเดล

เวลาที่แพทย์รังสีดูภาพเอกซเรย์ คุณหมอมักจะพิมพ์รายงาน เพื่อบอกแพทย์ท่านอื่นว่าคุณหมอเห็นอะไรบ้างในภาพเอกซเรย์ รายงานเหล่านี้เป็นภาษาธรรมชาติ เช่น “bony thorax  is intact” หมายความว่า ไม่พบว่ากระดูกแตก ปัญหาคือปัญญาประดิษฐ์ไม่เข้าใจภาษาคน จึงต้องมีการแปลงรายงานของคุณหมอที่เป็นภาษาคนให้กลายมาเป็นตัวเลขเสียก่อน
เช่น ถ้าแพทย์รังสีพิมพ์ว่า “bony thorax  is intact” หรือ “the visualized skeleton is normal” เราต้องบอกโมเดลว่า fracture=0 คือไม่พบภาวะกระดูกร้าวแตก ถ้าแพทย์พิมพ์ว่า “small but apparent damage to the thoracic cage” เราต้องบอกโมเดลว่า fracture=1 คือกระดูกซี่โครงมีรอยแตก
เนื่องจากเรามีรายงานแพทย์จำนวนมากเป็นล้านรีพอร์ท และรายงานเหล่านี้อาจจะยาวหลายย่อหน้าหรือสั้นจนไม่มีรายละเอียดใดๆเลยก็ได้ ภาษาและคำศัพท์ที่ใช้ก็อาจจะแตกต่างแล้วแต่สไตล์การเขียนของแพทย์แต่ละคน โดยเฉพาะแพทย์ไทยที่อาจจะไม่ได้ใช้ภาษาอังกฤษเป็นภาษาหลัก ทำให้มีการสะกดผิดและมีปัญหาไวยากรณ์ และเรามีภาวะผิดปกติที่เราต้องตรวจจับจากรายงานถึง 17 สภาวะ
ขั้นตอนการแปลจากรายงานของแพทย์เป็นตัวเลขที่มาสอนอัลกอริทึมจึงเป็นงานยากที่ต้องใช้เอไอขั้นเทพด้วยตัวของมันเอง ตั้งแต่ยังไม่ได้เริ่มเรียนรู้ภาพถ่ายเลยด้วยซ้ำ

สิ่งที่ยากไปกว่านั้นแม้ว่าเราจะสามารถอ่านรายงานของแพทย์ได้อย่างแม่นยำ ผลที่ได้ก็อาจจะมีความไม่แน่นอน โดยปกติแล้วมีการศึกษาเชิงสถิติมาแล้วว่า แพทย์รังสีที่ได้รับการรับรอง 3 ท่านดูภาพถ่ายเอกซเรย์ภาพเดียวกัน แล้วจะอ่านผลได้ตรงกันมีเพียง 75.7% เท่านั้น [1]
กล่าวคือถ้าเราวัดความถูกต้องของแพทย์รังสีที่เป็นมนุษย์ โดยใช้ standard เดียวกับเอไอ (คือต้องสามารถทายว่าภาพเป็นโรคหรือไม่เป็นโรคได้ถูกต้องตรงกับแพทย์ส่วนใหญ่) ก็เรียกได้ว่าเป็นเอไอที่ความแม่นยำแค่ 75%

ปัญหา noisy labels หรือความไม่แน่นอนของรายการแพทย์ที่นำมาสอนเอไอ จึงเป็นอีกปัญหาหนึ่งที่ต้องได้รับการจัดการด้วยวิธีทางคณิตศาสตร์ โดยเฉพาะในเคสยากๆที่แพทย์มักจะเห็นไม่ตรงกัน เอไอจะต้องรู้เท่าทันว่าจะต้องระมัดระวัง ไม่เชื่อรายงานแพทย์อันใดอันหนึ่งมากเกินไประหว่างที่เรียนรู้

ระบบสารสนเทศของโรงพยาบาลยังไม่พร้อมสำหรับปัญญาประดิษฐ์

เมื่อพัฒนาเอไอเสร็จเรียบร้อยแล้ว เราต้องหาทางนำปัญญาประดิษฐ์ที่เราสร้างไปแทรกในขั้นตอนการทำงานของแพทย์ เช่น ขณะที่แพทย์เปิดภาพเอกซเรย์ขึ้นมาดูจะต้องสามารถเรียกรายงานจากปัญญาประดิษฐ์มาดูประกอบการวินิจฉัยได้ทันทีเพื่อให้ผลลัพธ์การคัดกรองมีประโยชน์ต่อการตรวจสุขภาพอย่างแท้จริง ด้วยความที่โรงพยาบาลส่วนใหญ่ ยังมีระบบสารสนเทศแบบดั้งเดิม ทำให้งานรวมระบบ (system integration) ไม่ใช่เรื่องง่ายเช่นกัน ภาพถ่ายทางการแพทย์ส่วนใหญ่ยังถูกล็อกอยู่ในระบบ PACs (Picture Archiving and Communication System) ไม่สามารถนำออกมาประมวลผลหรือส่งไปยังระบบอื่นได้โดยง่าย การจะนำปัญญาประดิษฐ์ไปใช้ โรงพยาบาลซึ่งเป็นเจ้าของข้อมูลจึงต้องพร้อมให้ความยินยอม รวมทั้งทำงานร่วมกับผู้ดูแลระบบเพื่อให้ปัญญาประดิษฐ์เข้าถึงภาพถ่ายทางการแพทย์ได้

นอกจากนี้ เมื่อเวลาผ่านไป ถ้าปัญญาประดิษฐ์ได้เรียนรู้จากข้อมูลภาพชุดอื่นๆ และสามารถวินิจฉัยภาพได้ดีขึ้น จะต้องมีกลไกในการอัพเดทตนเอง บางครั้งอาจจะพบว่ามีกลุ่มภาพที่เรียกได้ว่าเป็นจุดบอดของอัลกอริธึม คือเป็นภาพแบบที่ไม่เคยมีตัวอย่างมากนักในอดีต ทำให้วินิจฉัยภาพผิดได้มาก การที่ปัญญาประดิษฐ์ได้เรียนรู้จากภาพใหม่ๆอยู่เสมอ จึงเป็นสิ่งสำคัญที่ทำให้ระบบเก่งขึ้นอย่างสม่ำเสมอ เป็นผลดีกับทุกคนที่ร่วมใช้ระบบเดียวกัน

โรงพยาบาลส่วนใหญ่ยังไม่เคยได้ใช้ปัญญาประดิษฐ์มาก่อน ไม่มีฮาร์ดแวร์ที่เหมาะจะประมวลผลภาพขนาดใหญ่ และขาดโครงสร้างพื้นฐานซอฟท์แวร์ในการอัพเดทและ deploy ปัญญาประดิษฐ์ แบบมีประสิทธิภาพ และขาดระบบในการติดตามว่าปัญญาประดิษฐ์นั้นยังมีประสิทธิภาพที่ดีอยู่หรือไม่
ด้วยเหตุนี้เอง ทางทีมเพอเซ็ปทราจึงต้องลงทุนสร้างระบบของเราบนคลาวด์สาธารณะที่มีความยืดหยุ่น สามารถขยายตัวได้เมื่อมีโหลดที่สูง มีจำนวนภาพมาก และหดได้เมื่อไม่มีภาพเข้ามา เพื่อประหยัดค่าใช้จ่าย และยังสามารถอัพเดทตนเอง วิเคราะห์ภาพชุดใหม่ และตรวจเช็คความถูกต้องแม่นยำได้ตลอดเวลา เพื่อให้มั่นใจว่าทุกโรงพยาบาลได้ใช้เอไอที่ดีที่สุดอยู่เสมอ

โรงพยาบาลใดที่สนใจนำปัญญาประดิษฐ์ไปช่วยในงานทางการแพทย์ โปรดติดต่อทีมเพอเซ็ปทราได้ที่หน้าติดต่อเราได้เลยค่ะ
คลิก : https://www.perceptra.tech/contact-us/

เอกสารอ้างอิง
https://arxiv.org/abs/1905.06362


Leave a Reply

Your email address will not be published. Required fields are marked *