อุปสรรคสำคัญในการสร้างปัญญาประดิษฐ์เพื่อการแพทย์ในประเทศไทย

กว่าหนึ่งปีแล้วที่บริษัทเพอเซ็ปทราทำงานอย่างมุ่งมั่นที่จะทำให้ปัญญาประดิษฐ์สามารถตรวจโรคจากภาพถ่ายทางการแพทย์ได้ในโลกจริง ความฝันของเราคือการทำให้ AI สามารถตรวจพบความผิดปกติในรูปถ่ายเอกซเรย์ เพื่อคัดกรองโรคที่ฆ่าชีวิตคนไทยได้ตั้งแต่ในระยะเริ่มต้น เช่น มะเร็งปอด ปอดติดเชื้อ ถุงลมโป่งพอง และวัณโรค เพื่อช่วยเพิ่มโอกาสการรักษาให้หายได้ และเราอยากเห็นทุกโรงพยาบาลในประเทศไทยได้ใช้ประโยชน์จากเอไอโดยทั่วกัน
แม้ว่าการนำเอาปัญญาประดิษฐ์มาตรวจภาพถ่ายทางการแพทย์ ไม่ใช่เรื่องใหม่แล้วในสังคมของนักวิชาการ มีหลายทีมในโลกนี้ที่อ้างว่า AI สามารถตรวจเช็คโรคได้แบบมีความแม่นยำเทียบเท่ารังสีแพทย์ ในฐานะคนทำงานด้านเทคโนโลยี เราก็เกิดความสงสัยว่า ทำไมเอไอเหล่านี้จึงไม่อยู่ในโรงพยาบาลทุกแห่ง วันนี้ทีมเพอเซ็ปทราอยากจะมาเล่า 3 อุปสรรคหลักที่เราพบเจอในเส้นทางของการนำปัญญาประดิษฐ์ออกสู่มวลชน

“AI ที่สามารถตรวจภาพถ่ายเอกซเรย์ในต่างประเทศได้ ไม่ได้หมายความว่าจะสามารถตรวจภาพของคนไทยได้”

ปัญหาใหญ่ในการสร้างปัญญาประดิษฐ์คือปัญหา “Overfitting” ถ้าจะอธิบายคำนี้ง่ายๆ ให้คนที่ไม่ได้มีพื้นฐานด้านเทคนิคเข้าใจ มันคือปัญหาที่คอมพิวเตอร์รู้จักภาพ แต่ไม่ได้เข้าใจภาพจริงๆ เช่น คอมพิวเตอร์อาจจะเคยเห็นภาพปอดเอกซเรย์ที่มีก้อนเนื้ออยู่ตรงปอดด้านขวา และมันสามารถจำภาพนั้นได้และเมื่อเจอภาพนั้นอีกครั้งก็อาจจะบอกได้ว่ามีก้อนเนื้ออยู่ แต่มันไม่ได้เข้าใจว่า “ก้อนเนื้อ” หน้าตาเป็นอย่างไร พอเราเอาภาพเอกซเรย์ที่มีก้อนเนื้ออยู่ตรงปอดด้านซ้าย คอมพิวเตอร์กลับไม่สามารถบอกได้ว่ามีก้อนเนื้ออยู่ เพราะที่ผ่านมามันท่องจำ แต่ไม่ได้เข้าใจจริงๆ ปัญญาประดิษฐ์แม้จะฉลาดมากก็จริง แต่ในขณะเดียวกันก็มีความไม่เฉลียว และสามารถถูกหลอกได้ง่ายมาก ภาพจากโรงพยาบาลไทยที่ถ่ายจากคนไข้ไทย ไม่ได้เพียงแต่มีสรีระที่แตกต่างจากภาพจากโรงพยาบาลต่างชาติ แต่เครื่องไม้ เครื่องมือในการถ่าย วิธีการตั้งค่าความเข้มของเอกซเรย์ ความสว่าง ความคมชัด จนกระทั่งสถิติของการเกิดโรค ล้วนแล้วแต่มีผลทำให้ภาพที่ออกมาแตกต่างกัน ในสายตามนุษย์ภาพเหล่านี้อาจจะดูเหมือนกันก็จริง แต่ในสายตาของคอมพิวเตอร์ภาพกลับต่างกันมากมาย แม้แต่ภาพจากคนละโรงพยาบาล ก็อาจจะต่างถึงขั้นทำให้ปัญญาประดิษฐ์ทำนายผิดพลาดได้

เราจะทำการแก้ไขปัญหา overfitting ได้อย่างไร?

1. รวบรวมภาพที่มีความหลากหลาย

รวบรวมภาพที่มีความหลากหลาย ทั้งมืด ทั้งสว่าง ทั้งคมชัด ทั้งมัว เพื่อนำมาเทรนโมเดลให้เก่งจริง นั่นเป็นเหตุผลว่าทำไมเพอเซ็ปทราจึงใช้เวลาและความร่วมมือกับโรงพยาบาล เพื่อรวบรวมภาพกว่า 2.5 ล้านภาพทั่วโลก มาสอนโมเดลให้รู้จักภาพปอดที่มีคุณลักษณะที่หลากหลาย

2. ใช้เทคนิคต่าง ๆ ในการเทรนโมเดล

ในการเทรนโมเดล เราใช้เทคนิคต่างๆที่บังคับให้โมเดลต้องเข้าใจภาพ เช่นการบิดภาพ การกลับภาพ การเพิ่มความเบลอของภาพ รวมทั้งปรับกระบวนการเทรนสร้างเป้าหมายใหม่เพื่อบอกโมเดลว่าไม่ต้องจำทุกภาพ รู้ไปหมดทุกภาพก็ได้ แต่ขอให้รู้จริงว่าคุณลักษณะใดบ่งบอกว่าปอดเป็นโรค

3. ใช้วิธีการทางคณิตศาสตร์ให้ภาพมีสถิติคล้ายคลึงกัน

เราใช้วิธีการทางคณิตศาสตร์อีกหลายวิธีที่ปรับภาพที่ไม่ใกล้เคียงกัน ให้กลายเป็นภาพที่มีสถิติคล้ายคลึงกันก่อนจะนำไปเข้าโมเดล คือการลดความหลากหลายของภาพที่ใช้สอนโมเดล ทำให้สามารถเข้าใจคุณลักษณะสำคัญได้เร็วขึ้น

ความไม่แน่นอนของรายงานการแพทย์ที่นำมาสอนโมเดล

เวลาที่แพทย์รังสีดูภาพเอกซเรย์ คุณหมอมักจะพิมพ์รายงาน เพื่อบอกแพทย์ท่านอื่นว่าคุณหมอเห็นอะไรบ้างในภาพเอกซเรย์ รายงานเหล่านี้เป็นภาษาธรรมชาติ เช่น “bony thorax is intact” หมายความว่า ไม่พบว่ากระดูกแตก ปัญหาคือปัญญาประดิษฐ์ไม่เข้าใจภาษาคน จึงต้องมีการแปลงรายงานของคุณหมอที่เป็นภาษาคนให้กลายมาเป็นตัวเลขเสียก่อน

เช่น ถ้าแพทย์รังสีพิมพ์ว่า “bony thorax is intact” หรือ “the visualized skeleton is normal” เราต้องบอกโมเดลว่า fracture=0 คือไม่พบภาวะกระดูกร้าวแตก ถ้าแพทย์พิมพ์ว่า “small but apparent damage to the thoracic cage” เราต้องบอกโมเดลว่า fracture=1 คือกระดูกซี่โครงมีรอยแตก

เนื่องจากเรามีรายงานแพทย์จำนวนมากเป็นล้านรีพอร์ท และรายงานเหล่านี้อาจจะยาวหลายย่อหน้าหรือสั้นจนไม่มีรายละเอียดใดๆเลยก็ได้ ภาษาและคำศัพท์ที่ใช้ก็อาจจะแตกต่างแล้วแต่สไตล์การเขียนของแพทย์แต่ละคน โดยเฉพาะแพทย์ไทยที่อาจจะไม่ได้ใช้ภาษาอังกฤษเป็นภาษาหลัก ทำให้มีการสะกดผิดและมีปัญหาไวยากรณ์ และเรามีภาวะผิดปกติที่เราต้องตรวจจับจากรายงานถึง 17 สภาวะ

ขั้นตอนการแปลจากรายงานของแพทย์เป็นตัวเลขที่มาสอนอัลกอริทึมจึงเป็นงานยากที่ต้องใช้เอไอขั้นเทพด้วยตัวของมันเอง ตั้งแต่ยังไม่ได้เริ่มเรียนรู้ภาพถ่ายเลยด้วยซ้ำ

สิ่งที่ยากไปกว่านั้นแม้ว่าเราจะสามารถอ่านรายงานของแพทย์ได้อย่างแม่นยำ ผลที่ได้ก็อาจจะมีความไม่แน่นอน โดยปกติแล้วมีการศึกษาเชิงสถิติมาแล้วว่า แพทย์รังสีในสหรัฐอเมริกาที่ได้รับการรับรอง 2 ท่านดูภาพถ่ายเอกซเรย์ภาพเดียวกัน แล้วจะอ่านผลได้ตรงกันจะเท่ากับ 87% [1]

กล่าวคือถ้าเราวัดความถูกต้องของแพทย์รังสีที่เป็นมนุษย์ โดยใช้ standard เดียวกับปัญญาประดิษฐ์ (คือต้องสามารถทายว่าภาพเป็นโรคหรือไม่เป็นโรคได้ถูกต้องตรงกับแพทย์อีกท่านหนึ่ง) ก็เรียกได้ว่าเป็นเอไอที่ความแม่นยำ 87%

ปัญหา noisy labels หรือความไม่แน่นอนของรายการแพทย์ที่นำมาสอนเอไอ จึงเป็นอีกปัญหาหนึ่งที่ต้องได้รับการจัดการด้วยวิธีทางคณิตศาสตร์ โดยเฉพาะในเคสยากๆที่แพทย์มักจะเห็นไม่ตรงกัน เอไอจะต้องรู้เท่าทันว่าจะต้องระมัดระวัง ไม่เชื่อรายงานแพทย์อันใดอันหนึ่งมากเกินไประหว่างที่เรียนรู้

ระบบสารสนเทศของโรงพยาบาลยังไม่พร้อมสำหรับปัญญาประดิษฐ์

เมื่อพัฒนาเอไอเสร็จเรียบร้อยแล้ว เราต้องหาทางนำปัญญาประดิษฐ์ที่เราสร้างไปแทรกในขั้นตอนการทำงานของแพทย์ เช่น ขณะที่แพทย์เปิดภาพเอกซเรย์ขึ้นมาดูจะต้องสามารถเรียกรายงานจากปัญญาประดิษฐ์มาดูประกอบการวินิจฉัยได้ทันทีเพื่อให้ผลลัพธ์การคัดกรองมีประโยชน์ต่อการตรวจสุขภาพอย่างแท้จริง ด้วยความที่โรงพยาบาลส่วนใหญ่ ยังมีระบบสารสนเทศแบบดั้งเดิม ทำให้งานรวมระบบ (system integration) ไม่ใช่เรื่องง่ายเช่นกัน ภาพถ่ายทางการแพทย์ส่วนใหญ่ยังถูกล็อกอยู่ในระบบ PACs (Picture Archiving and Communication System) ไม่สามารถนำออกมาประมวลผลหรือส่งไปยังระบบอื่นได้โดยง่าย การจะนำปัญญาประดิษฐ์ไปใช้ โรงพยาบาลซึ่งเป็นเจ้าของข้อมูลจึงต้องพร้อมให้ความยินยอม รวมทั้งทำงานร่วมกับผู้ดูแลระบบเพื่อให้ปัญญาประดิษฐ์เข้าถึงภาพถ่ายทางการแพทย์ได้

นอกจากนี้ เมื่อเวลาผ่านไป ถ้าปัญญาประดิษฐ์ได้เรียนรู้จากข้อมูลภาพชุดอื่นๆ และสามารถวินิจฉัยภาพได้ดีขึ้น จะต้องมีกลไกในการอัพเดทตนเอง บางครั้งอาจจะพบว่ามีกลุ่มภาพที่เรียกได้ว่าเป็นจุดบอดของอัลกอริธึม คือเป็นภาพแบบที่ไม่เคยมีตัวอย่างมากนักในอดีต ทำให้วินิจฉัยภาพผิดได้มาก การที่ปัญญาประดิษฐ์ได้เรียนรู้จากภาพใหม่ๆอยู่เสมอ จึงเป็นสิ่งสำคัญที่ทำให้ระบบเก่งขึ้นอย่างสม่ำเสมอ เป็นผลดีกับทุกคนที่ร่วมใช้ระบบเดียวกัน

โรงพยาบาลส่วนใหญ่ยังไม่เคยได้ใช้ปัญญาประดิษฐ์มาก่อน ไม่มีฮาร์ดแวร์ที่เหมาะจะประมวลผลภาพขนาดใหญ่ และขาดโครงสร้างพื้นฐานซอฟท์แวร์ในการอัพเดทและ deploy ปัญญาประดิษฐ์ แบบมีประสิทธิภาพ และขาดระบบในการติดตามว่าปัญญาประดิษฐ์นั้นยังมีประสิทธิภาพที่ดีอยู่หรือไม่

ด้วยเหตุนี้เอง ทางทีมเพอเซ็ปทราจึงต้องลงทุนสร้างระบบของเราบนคลาวด์สาธารณะที่มีความยืดหยุ่น สามารถขยายตัวได้เมื่อมีโหลดที่สูง มีจำนวนภาพมาก และหดได้เมื่อไม่มีภาพเข้ามา เพื่อประหยัดค่าใช้จ่าย และยังสามารถอัพเดทตนเอง วิเคราะห์ภาพชุดใหม่ และตรวจเช็คความถูกต้องแม่นยำได้ตลอดเวลา เพื่อให้มั่นใจว่าทุกโรงพยาบาลได้ใช้เอไอที่ดีที่สุดอยู่เสมอ

Related Resources

Navigating the Waves of AI Technology in Healthcare

19/04/2024

Seminar

AI in medical imaging: What Radiologist Should Know

If AI in medical imaging is inevitable, what should radiologists know? The insight led by Arunnit Boonrod, M.D. and lecturer at Department of Radiology, Khon Kaen University.

12/04/2024

Seminar

Beyond Quantity: Just a Large Dataset Is Not Enough for AI in Medical Imaging

Have you ever heard that good AI needs a massive amount of data to learn? While that's certainly true, it's actually just one piece of the puzzle. Perceptra model team believes that true "good" AI in medical imaging goes beyond the size

15/03/2024

Data Model