คำอธิบายประกอบข้อมูล – NER

การรับรู้เอนทิตีที่มีชื่อ (NER) คำอธิบายประกอบสำหรับ NLP ทางคลินิก

คำอธิบายประกอบ Ner

ข้อมูลข้อความทางคลินิกที่มีคำอธิบายประกอบอย่างดีและมาตรฐานทองคำเพื่อฝึกอบรม/พัฒนา NLP ทางคลินิกเพื่อสร้าง Healthcare API เวอร์ชันถัดไป

ความสำคัญของการประมวลผลภาษาธรรมชาติทางคลินิก (NLP) ได้รับการยอมรับมากขึ้นในช่วงหลายปีที่ผ่านมา และได้นำไปสู่ความก้าวหน้าในการเปลี่ยนแปลง NLP ทางคลินิกช่วยให้คอมพิวเตอร์เข้าใจความหมายอันยาวนานซึ่งอยู่เบื้องหลังการวิเคราะห์ที่เป็นลายลักษณ์อักษรของแพทย์เกี่ยวกับผู้ป่วย NLP ทางคลินิกสามารถมีกรณีการใช้งานได้หลายกรณี ตั้งแต่การวิเคราะห์สุขภาพของประชากร การปรับปรุงเอกสารทางคลินิก การรู้จำเสียง การจับคู่การทดลองทางคลินิก เป็นต้น

ในการพัฒนาและฝึกอบรมโมเดล NLP ทางคลินิกใดๆ คุณต้องมีชุดข้อมูลที่แม่นยำ เป็นกลาง และมีคำอธิบายประกอบที่ดีในปริมาณมหาศาล Gold Standard และข้อมูลที่หลากหลายช่วยเพิ่มความแม่นยำและการเรียกคืนกลไก NLP

ปริมาณ

จำนวนเอกสารที่มีคำอธิบายประกอบ
10
จำนวนหน้าที่มีคำอธิบายประกอบ
10 +
ระยะเวลาโครงการ
< 1 เดือน

ความท้าทาย

ลูกค้าตั้งตารอที่จะฝึกอบรมและพัฒนาแพลตฟอร์มการประมวลผลภาษาธรรมชาติ (NLP) ด้วยเอนทิตีประเภทใหม่ และยังระบุความสัมพันธ์ระหว่างประเภทต่างๆ นอกจากนี้ พวกเขากำลังประเมินผู้ขายที่นำเสนอความแม่นยำสูง ปฏิบัติตามกฎหมายท้องถิ่น และมีความรู้ทางการแพทย์ที่จำเป็นในการใส่คำอธิบายประกอบชุดข้อมูลขนาดใหญ่

ภารกิจคือการติดป้ายกำกับและใส่คำอธิบายประกอบบันทึกที่มีป้ายกำกับมากถึง 20,000 รายการ รวมถึงบันทึกที่มีป้ายกำกับสูงสุด 15,000 รายการจากข้อมูลบันทึกสุขภาพอิเล็กทรอนิกส์ (EHR) ของผู้ป่วยในและนอก และบันทึกที่มีป้ายกำกับสูงสุด 5,000 รายการจากการถอดความตามคำบอกทางการแพทย์ โดยมีการกระจายเท่าๆ กันใน (1) แหล่งที่มาทางภูมิศาสตร์ และ ( 2) ความเชี่ยวชาญทางการแพทย์ที่มีอยู่

ดังนั้นเพื่อสรุปความท้าทาย:

  • จัดระเบียบข้อมูลทางคลินิกที่แตกต่างกันเพื่อฝึกอบรมแพลตฟอร์ม NLP
  • ระบุความสัมพันธ์ระหว่างหน่วยงานต่างๆ เพื่อให้ได้ข้อมูลที่สำคัญ
  • ความสามารถและความเชี่ยวชาญในการติดป้ายกำกับ / ใส่คำอธิบายประกอบเอกสารทางคลินิกที่ซับซ้อนในวงกว้าง
  • ควบคุมต้นทุนในการติดป้ายกำกับ / ใส่คำอธิบายประกอบข้อมูลจำนวนมากเพื่อฝึกอบรม NLP ทางคลินิกภายในกรอบเวลาที่กำหนด
  • ใส่คำอธิบายประกอบเอนทิตีในชุดข้อมูลทางคลินิกที่ประกอบด้วยบันทึก EHR 75% และบันทึกตามคำบอก 25%
  • การลบข้อมูลระบุตัวตน ณ เวลาที่จัดส่ง

ความท้าทายอื่นๆ ในการทำความเข้าใจภาษาธรรมชาติ

ความคลุมเครือ

คำต่างๆ มีลักษณะเฉพาะตัวแต่สามารถมีความหมายที่แตกต่างกันได้ ขึ้นอยู่กับบริบท ส่งผลให้เกิดความคลุมเครือในระดับคำศัพท์ วากยสัมพันธ์ และความหมาย

พ้อง

เราสามารถแสดงแนวคิดเดียวกันด้วยคำที่แตกต่างกันซึ่งเป็นคำพ้องความหมายเช่นกัน: ใหญ่และใหญ่มีความหมายเหมือนกันเมื่ออธิบายวัตถุ

แกนกลาง

กระบวนการค้นหานิพจน์ทั้งหมดที่อ้างถึงเอนทิตีเดียวกันในข้อความเรียกว่าการแก้ปัญหาหลัก

บุคลิกภาพ ความตั้งใจ อารมณ์

ขึ้นอยู่กับบุคลิกภาพของผู้พูด ความตั้งใจและอารมณ์ของพวกเขาอาจแสดงออกมาแตกต่างกันสำหรับแนวคิดเดียวกัน

Solution

ข้อมูลและความรู้ทางการแพทย์จำนวนมากมีอยู่ในรูปแบบของเอกสารทางการแพทย์ แต่ส่วนใหญ่จะอยู่ในรูปแบบที่ไม่มีโครงสร้าง ด้วยคำอธิบายประกอบเอนทิตีทางการแพทย์ / คำอธิบายประกอบการจดจำเอนทิตีที่มีชื่อ (NER) Shaip สามารถแปลงข้อมูลที่ไม่มีโครงสร้างเป็นรูปแบบที่มีโครงสร้างโดยการใส่คำอธิบายประกอบข้อมูลที่เป็นประโยชน์จากบันทึกทางคลินิกประเภทต่างๆ เมื่อระบุเอนทิตีแล้ว ความสัมพันธ์ระหว่างสิ่งเหล่านั้นก็จะถูกแมปเพื่อระบุข้อมูลที่สำคัญด้วย

ขอบเขตของงาน: คำอธิบายประกอบการกล่าวถึงเอนทิตีด้านการดูแลสุขภาพ

9 ประเภทเอนทิตี

  • เงื่อนไขทางการแพทย์
  • ขั้นตอนการแพทย์
  • โครงสร้างทางกายวิภาค
  • ยา
  • อุปกรณ์ทางการแพทย์
  • วัดร่างกาย
  • ใช้สารเสพติด
  • ข้อมูลห้องปฏิบัติการ
  • การทำงานของร่างกาย

ตัวดัดแปลง 17 ตัว

  • ตัวปรับเปลี่ยนยา: ความแรง, หน่วย, ปริมาณ, จาก, ความถี่, เส้นทาง, ระยะเวลา, สถานะ
  • ตัวดัดแปลงการวัดร่างกาย: ค่า, หน่วย, ผลลัพธ์
  • ตัวปรับเปลี่ยนขั้นตอน: วิธีการ
    • ตัวแก้ไขข้อมูลห้องปฏิบัติการ: มูลค่าห้องปฏิบัติการ, หน่วยห้องปฏิบัติการ, ผลลัพธ์ของห้องปฏิบัติการ
  • ความรุนแรง
  • ผลลัพธ์ของขั้นตอน

27 ความสัมพันธ์และสถานะผู้ป่วย

ผล

ข้อมูลที่มีคำอธิบายประกอบจะถูกนำมาใช้เพื่อพัฒนาและฝึกอบรมแพลตฟอร์ม NLP ทางคลินิกของลูกค้า ซึ่งจะรวมอยู่ใน Healthcare API เวอร์ชันถัดไป ประโยชน์ที่ลูกค้าได้รับคือ:

  • ข้อมูลที่มีป้ายกำกับ/มีคำอธิบายประกอบเป็นไปตามหลักเกณฑ์คำอธิบายประกอบข้อมูลมาตรฐานของลูกค้า
  • ชุดข้อมูลที่แตกต่างกันถูกนำมาใช้ในการฝึกอบรมแพลตฟอร์ม NLP เพื่อความแม่นยำที่มากขึ้น
  • ความสัมพันธ์ระหว่างหน่วยงานที่แตกต่างกัน เช่น โครงสร้างทางกายวิภาค <> อุปกรณ์การแพทย์ สภาพทางการแพทย์ <> อุปกรณ์การแพทย์ สภาพทางการแพทย์ <> ยา สภาพทางการแพทย์ <> ขั้นตอนได้รับการระบุเพื่อให้ได้ข้อมูลทางการแพทย์ที่สำคัญ
  • ชุดข้อมูลกว้างๆ ที่มีป้ายกำกับ/คำอธิบายประกอบก็ถูกยกเลิกการระบุตัวตน ณ เวลาที่จัดส่งด้วย

ความร่วมมือของเรากับ Shaip ทำให้โครงการของเราในด้านเทคโนโลยี Ambient และ AI การสนทนาในการดูแลสุขภาพก้าวหน้าไปอย่างมาก ความเชี่ยวชาญของพวกเขาในการสร้างและถอดความบทสนทนาด้านการดูแลสุขภาพสังเคราะห์เป็นรากฐานที่มั่นคง ซึ่งแสดงให้เห็นถึงศักยภาพของข้อมูลสังเคราะห์ในการเอาชนะความท้าทายด้านกฎระเบียบ ด้วย Shaip เราได้ฝ่าฟันอุปสรรคเหล่านี้ และตอนนี้เข้าใกล้การบรรลุวิสัยทัศน์ด้านโซลูชันการดูแลสุขภาพที่ใช้งานง่ายไปอีกก้าวหนึ่งแล้ว

โกลเด้น-5 ดาว

เร่งความเร็ว AI การสนทนาของคุณ
การพัฒนาแอปพลิเคชันโดย 100%