คำอธิบายประกอบข้อมูล – NER
การรับรู้เอนทิตีที่มีชื่อ (NER) คำอธิบายประกอบสำหรับ NLP ทางคลินิก
ข้อมูลข้อความทางคลินิกที่มีคำอธิบายประกอบอย่างดีและมาตรฐานทองคำเพื่อฝึกอบรม/พัฒนา NLP ทางคลินิกเพื่อสร้าง Healthcare API เวอร์ชันถัดไป
ความสำคัญของการประมวลผลภาษาธรรมชาติทางคลินิก (NLP) ได้รับการยอมรับมากขึ้นในช่วงหลายปีที่ผ่านมา และได้นำไปสู่ความก้าวหน้าในการเปลี่ยนแปลง NLP ทางคลินิกช่วยให้คอมพิวเตอร์เข้าใจความหมายอันยาวนานซึ่งอยู่เบื้องหลังการวิเคราะห์ที่เป็นลายลักษณ์อักษรของแพทย์เกี่ยวกับผู้ป่วย NLP ทางคลินิกสามารถมีกรณีการใช้งานได้หลายกรณี ตั้งแต่การวิเคราะห์สุขภาพของประชากร การปรับปรุงเอกสารทางคลินิก การรู้จำเสียง การจับคู่การทดลองทางคลินิก เป็นต้น
ในการพัฒนาและฝึกอบรมโมเดล NLP ทางคลินิกใดๆ คุณต้องมีชุดข้อมูลที่แม่นยำ เป็นกลาง และมีคำอธิบายประกอบที่ดีในปริมาณมหาศาล Gold Standard และข้อมูลที่หลากหลายช่วยเพิ่มความแม่นยำและการเรียกคืนกลไก NLP
ปริมาณ
ความท้าทาย
ลูกค้าตั้งตารอที่จะฝึกอบรมและพัฒนาแพลตฟอร์มการประมวลผลภาษาธรรมชาติ (NLP) ด้วยเอนทิตีประเภทใหม่ และยังระบุความสัมพันธ์ระหว่างประเภทต่างๆ นอกจากนี้ พวกเขากำลังประเมินผู้ขายที่นำเสนอความแม่นยำสูง ปฏิบัติตามกฎหมายท้องถิ่น และมีความรู้ทางการแพทย์ที่จำเป็นในการใส่คำอธิบายประกอบชุดข้อมูลขนาดใหญ่
ภารกิจคือการติดป้ายกำกับและใส่คำอธิบายประกอบบันทึกที่มีป้ายกำกับมากถึง 20,000 รายการ รวมถึงบันทึกที่มีป้ายกำกับสูงสุด 15,000 รายการจากข้อมูลบันทึกสุขภาพอิเล็กทรอนิกส์ (EHR) ของผู้ป่วยในและนอก และบันทึกที่มีป้ายกำกับสูงสุด 5,000 รายการจากการถอดความตามคำบอกทางการแพทย์ โดยมีการกระจายเท่าๆ กันใน (1) แหล่งที่มาทางภูมิศาสตร์ และ ( 2) ความเชี่ยวชาญทางการแพทย์ที่มีอยู่
ดังนั้นเพื่อสรุปความท้าทาย:
- จัดระเบียบข้อมูลทางคลินิกที่แตกต่างกันเพื่อฝึกอบรมแพลตฟอร์ม NLP
- ระบุความสัมพันธ์ระหว่างหน่วยงานต่างๆ เพื่อให้ได้ข้อมูลที่สำคัญ
- ความสามารถและความเชี่ยวชาญในการติดป้ายกำกับ / ใส่คำอธิบายประกอบเอกสารทางคลินิกที่ซับซ้อนในวงกว้าง
- ควบคุมต้นทุนในการติดป้ายกำกับ / ใส่คำอธิบายประกอบข้อมูลจำนวนมากเพื่อฝึกอบรม NLP ทางคลินิกภายในกรอบเวลาที่กำหนด
- ใส่คำอธิบายประกอบเอนทิตีในชุดข้อมูลทางคลินิกที่ประกอบด้วยบันทึก EHR 75% และบันทึกตามคำบอก 25%
- การลบข้อมูลระบุตัวตน ณ เวลาที่จัดส่ง
ความท้าทายอื่นๆ ในการทำความเข้าใจภาษาธรรมชาติ
คำต่างๆ มีลักษณะเฉพาะตัวแต่สามารถมีความหมายที่แตกต่างกันได้ ขึ้นอยู่กับบริบท ส่งผลให้เกิดความคลุมเครือในระดับคำศัพท์ วากยสัมพันธ์ และความหมาย
เราสามารถแสดงแนวคิดเดียวกันด้วยคำที่แตกต่างกันซึ่งเป็นคำพ้องความหมายเช่นกัน: ใหญ่และใหญ่มีความหมายเหมือนกันเมื่ออธิบายวัตถุ
กระบวนการค้นหานิพจน์ทั้งหมดที่อ้างถึงเอนทิตีเดียวกันในข้อความเรียกว่าการแก้ปัญหาหลัก
ขึ้นอยู่กับบุคลิกภาพของผู้พูด ความตั้งใจและอารมณ์ของพวกเขาอาจแสดงออกมาแตกต่างกันสำหรับแนวคิดเดียวกัน
Solution
ข้อมูลและความรู้ทางการแพทย์จำนวนมากมีอยู่ในรูปแบบของเอกสารทางการแพทย์ แต่ส่วนใหญ่จะอยู่ในรูปแบบที่ไม่มีโครงสร้าง ด้วยคำอธิบายประกอบเอนทิตีทางการแพทย์ / คำอธิบายประกอบการจดจำเอนทิตีที่มีชื่อ (NER) Shaip สามารถแปลงข้อมูลที่ไม่มีโครงสร้างเป็นรูปแบบที่มีโครงสร้างโดยการใส่คำอธิบายประกอบข้อมูลที่เป็นประโยชน์จากบันทึกทางคลินิกประเภทต่างๆ เมื่อระบุเอนทิตีแล้ว ความสัมพันธ์ระหว่างสิ่งเหล่านั้นก็จะถูกแมปเพื่อระบุข้อมูลที่สำคัญด้วย
ขอบเขตของงาน: คำอธิบายประกอบการกล่าวถึงเอนทิตีด้านการดูแลสุขภาพ
9 ประเภทเอนทิตี
- เงื่อนไขทางการแพทย์
- ขั้นตอนการแพทย์
- โครงสร้างทางกายวิภาค
- ยา
- อุปกรณ์ทางการแพทย์
- วัดร่างกาย
- ใช้สารเสพติด
- ข้อมูลห้องปฏิบัติการ
- การทำงานของร่างกาย
ตัวดัดแปลง 17 ตัว
- ตัวปรับเปลี่ยนยา: ความแรง, หน่วย, ปริมาณ, จาก, ความถี่, เส้นทาง, ระยะเวลา, สถานะ
- ตัวดัดแปลงการวัดร่างกาย: ค่า, หน่วย, ผลลัพธ์
- ตัวปรับเปลี่ยนขั้นตอน: วิธีการ
• ตัวแก้ไขข้อมูลห้องปฏิบัติการ: มูลค่าห้องปฏิบัติการ, หน่วยห้องปฏิบัติการ, ผลลัพธ์ของห้องปฏิบัติการ - ความรุนแรง
- ผลลัพธ์ของขั้นตอน
27 ความสัมพันธ์และสถานะผู้ป่วย
ผล
ข้อมูลที่มีคำอธิบายประกอบจะถูกนำมาใช้เพื่อพัฒนาและฝึกอบรมแพลตฟอร์ม NLP ทางคลินิกของลูกค้า ซึ่งจะรวมอยู่ใน Healthcare API เวอร์ชันถัดไป ประโยชน์ที่ลูกค้าได้รับคือ:
- ข้อมูลที่มีป้ายกำกับ/มีคำอธิบายประกอบเป็นไปตามหลักเกณฑ์คำอธิบายประกอบข้อมูลมาตรฐานของลูกค้า
- ชุดข้อมูลที่แตกต่างกันถูกนำมาใช้ในการฝึกอบรมแพลตฟอร์ม NLP เพื่อความแม่นยำที่มากขึ้น
- ความสัมพันธ์ระหว่างหน่วยงานที่แตกต่างกัน เช่น โครงสร้างทางกายวิภาค <> อุปกรณ์การแพทย์ สภาพทางการแพทย์ <> อุปกรณ์การแพทย์ สภาพทางการแพทย์ <> ยา สภาพทางการแพทย์ <> ขั้นตอนได้รับการระบุเพื่อให้ได้ข้อมูลทางการแพทย์ที่สำคัญ
- ชุดข้อมูลกว้างๆ ที่มีป้ายกำกับ/คำอธิบายประกอบก็ถูกยกเลิกการระบุตัวตน ณ เวลาที่จัดส่งด้วย
ความร่วมมือของเรากับ Shaip ทำให้โครงการของเราในด้านเทคโนโลยี Ambient และ AI การสนทนาในการดูแลสุขภาพก้าวหน้าไปอย่างมาก ความเชี่ยวชาญของพวกเขาในการสร้างและถอดความบทสนทนาด้านการดูแลสุขภาพสังเคราะห์เป็นรากฐานที่มั่นคง ซึ่งแสดงให้เห็นถึงศักยภาพของข้อมูลสังเคราะห์ในการเอาชนะความท้าทายด้านกฎระเบียบ ด้วย Shaip เราได้ฝ่าฟันอุปสรรคเหล่านี้ และตอนนี้เข้าใกล้การบรรลุวิสัยทัศน์ด้านโซลูชันการดูแลสุขภาพที่ใช้งานง่ายไปอีกก้าวหนึ่งแล้ว