กรณีศึกษา: การรวบรวมคำพูด

ส่งมอบ 7M+ Utterances เพื่อสร้างผู้ช่วยดิจิทัลหลายภาษาใน 13 ภาษา

การรวบรวมคำพูด

โซลูชั่นโลกแห่งความจริง

ข้อมูลที่ขับเคลื่อนการสนทนาทั่วโลก

ความจำเป็นในการฝึกอบรม Utterance เกิดขึ้นเนื่องจากลูกค้าบางรายอาจใช้คำหรือวลีที่แน่นอนในขณะที่โต้ตอบหรือถามคำถามกับผู้ช่วยเสียงในรูปแบบสคริปต์ นั่นเป็นเหตุผลที่แอปพลิเคชันเสียงเฉพาะต้องได้รับการฝึกอบรมเกี่ยวกับข้อมูลเสียงพูดที่เกิดขึ้นเอง เช่น “โรงพยาบาลที่ใกล้ที่สุดอยู่ที่ไหน” “หาโรงพยาบาลใกล้ฉัน” หรือ “มีโรงพยาบาลใกล้ๆ ไหม” ทั้งหมดระบุจุดประสงค์ในการค้นหาเดียวกันแต่ใช้ถ้อยคำต่างกัน

การรวบรวมคำพูด1

ปัญหา

เพื่อดำเนินการตามแผนงานการพูดของผู้ช่วยดิจิทัลของลูกค้าสำหรับภาษาทั่วโลก ทีมงานจำเป็นต้องได้รับข้อมูลการฝึกอบรมจำนวนมากสำหรับโมเดล AI การรู้จำเสียงพูด ข้อกำหนดที่สำคัญของลูกค้าคือ:

  • รับข้อมูลการฝึกอบรมจำนวนมาก (พร้อมท์คำพูดของผู้พูดคนเดียวที่มีความยาวไม่เกิน 3-30 วินาที ) สำหรับบริการรู้จำเสียงพูดใน 13 ภาษาทั่วโลก
  • สำหรับแต่ละภาษา ซัพพลายเออร์จะสร้างข้อความแจ้งให้ผู้พูดบันทึก (เว้นแต่
    อุปกรณ์ของลูกค้า) และถ่ายทอดเสียงที่ได้
  • ให้ข้อมูลเสียงและการถอดเสียงคำพูดที่บันทึกไว้ด้วยไฟล์ JSON ที่สอดคล้องกัน
    มีข้อมูลเมตาสำหรับการบันทึกทั้งหมด
  • รับรองผู้พูดที่หลากหลายตามอายุ เพศ การศึกษา และภาษาถิ่น
  • ตรวจสอบให้แน่ใจว่ามีสภาพแวดล้อมการบันทึกที่หลากหลายตามข้อกำหนด
  • การบันทึกเสียงแต่ละรายการต้องมีอย่างน้อย 16kHz แต่ควรเป็น 44kHz

เร่งความเร็ว AI การสนทนาของคุณ
การพัฒนาแอปพลิเคชันโดย 100%

“หลังจากประเมินผู้ค้าหลายรายแล้ว ลูกค้าเลือก Shaip เนื่องจากความเชี่ยวชาญในโครงการ AI เชิงสนทนา เราประทับใจในความสามารถในการดำเนินโครงการของ Shaip ความเชี่ยวชาญในแหล่งที่มา การถอดเสียง และส่งมอบคำปราศรัยที่จำเป็นจากนักภาษาศาสตร์ผู้เชี่ยวชาญใน 13 ภาษาภายในระยะเวลาที่เข้มงวดและมีคุณภาพตามที่กำหนด”

Solution

ด้วยความเข้าใจอย่างลึกซึ้งเกี่ยวกับ AI ในการสนทนา เราจึงช่วยลูกค้ารวบรวม ถอดเสียง และใส่คำอธิบายประกอบข้อมูลกับทีมนักภาษาศาสตร์ผู้เชี่ยวชาญและผู้ทำหมายเหตุประกอบเพื่อฝึกอบรมชุดเสียงหลายภาษาที่ประมวลผลคำพูดที่ขับเคลื่อนด้วย AI

ขอบเขตของงานสำหรับ Shaip รวมอยู่ด้วยแต่ไม่จำกัดเพียงการรับข้อมูลการฝึกเสียงจำนวนมากสำหรับการรู้จำคำพูด การถอดเสียงการบันทึกเสียงในหลายภาษาสำหรับทุกภาษาในแผนงานภาษาระดับ Tier 1 และ Tier 2 และการนำเสนอที่สอดคล้องกัน JSON ไฟล์ที่มีข้อมูลเมตา Shaip รวบรวมคำพูดในระดับ 3-30 วินาทีในขณะที่รักษาระดับคุณภาพที่ต้องการซึ่งจำเป็นในการฝึกแบบจำลอง ML สำหรับโครงการที่ซับซ้อน

  • เสียงที่รวบรวม ถอดความ และใส่คำอธิบายประกอบ: 22,250 ชั่วโมง
  • ภาษาที่รองรับ: 13 (เดนมาร์ก เกาหลี อาหรับซาอุดีอาระเบีย ดัตช์ จีนแผ่นดินใหญ่และไต้หวัน ฝรั่งเศส แคนาดา สเปนเม็กซิกัน ตุรกี ฮินดี โปแลนด์ ญี่ปุ่น รัสเซีย)
  • จำนวนคำพูด: 7M +
  • ระยะเวลา: เดือน 7 8-

ชุดเสียงหลายภาษาสำหรับการประมวลผลคำพูดที่ขับเคลื่อนด้วย AI

ขณะรวบรวมเสียงพูดที่ 16 kHz เรามั่นใจว่าผู้พูดจะผสมกันอย่างเหมาะสมตามอายุ เพศ การศึกษา และภาษาถิ่นในสภาพแวดล้อมการบันทึกที่หลากหลาย

ผล

ข้อมูลเสียงการเปล่งเสียงคุณภาพสูงจากนักภาษาศาสตร์ผู้เชี่ยวชาญช่วยให้ลูกค้าฝึกโมเดลการรู้จำเสียงพูดหลายภาษาได้อย่างแม่นยำใน 13 ภาษา Global Tier 1 และ 2 ด้วยชุดข้อมูลการฝึกอบรมมาตรฐานทองคำ ลูกค้าสามารถให้ความช่วยเหลือทางดิจิทัลที่ชาญฉลาดและแข็งแกร่งเพื่อแก้ปัญหาในโลกแห่งความเป็นจริงในอนาคต

ข้อมูลเสียงคำพูดคุณภาพสูง

ความเชี่ยวชาญของเรา

รวบรวมชั่วโมงการพูด
0 +
ทีมนักรวบรวมข้อมูลเสียง
0
สอดคล้องกับ PII
0 %
เลขเด็ด
0 +
การยอมรับและความถูกต้องของข้อมูล
> 0
ลูกค้าฟอร์จูน 500
0 +

บอกเราว่าเราสามารถช่วยความคิดริเริ่มด้าน AI ครั้งต่อไปของคุณได้อย่างไร