การรวบรวมข้อมูลการฝึกอบรมคำปลุกแบบกำหนดเองและมีแบรนด์

สร้างแอปเสียงที่คอยฟังอยู่ตลอดเวลาด้วยข้อมูลการฝึกคำสั่งปลุกแบบกำหนดเอง ความแม่นยำในการตรวจจับสูงขึ้น การทำงานผิดพลาดน้อยลง

การรวบรวมข้อมูลการฝึกอบรมคำศัพท์ Wake

สร้างเกตเวย์ระหว่างคุณและผลิตภัณฑ์เสียงของคุณด้วยคำปลุกที่ถูกต้องและปรับแต่งได้ และเพิ่มความสามารถในการตรวจจับคำของผู้ช่วยเสียงเพื่อช่วยให้คุณนำหน้าคู่แข่ง

ผู้ช่วยเสียงได้เปลี่ยนแปลงวิธีที่ลูกค้าโต้ตอบกับอุปกรณ์ของตนอย่างมาก พวกเขาทำให้ผู้ใช้สามารถสำรวจผลิตภัณฑ์และบริการได้ง่ายขึ้นอย่างรวดเร็วและมีประสิทธิภาพ อย่างไรก็ตาม แอปพลิเคชั่นเสียงกำลังฟังอยู่หรือไม่? ในการทำให้แอปพลิเคชันเหล่านี้อยู่ในไดรฟ์ระดับสูง จำเป็นต้องปลุกและเปลี่ยนจากการฟังแบบพาสซีฟเป็นการฟังแบบแอคทีฟด้วยความช่วยเหลือของ WAKE WORDS 'Alexa' และ "หวัดดี Siri' เป็นคำปลุกยอดนิยมสองคำในโลก

Statista

ภายในปี 2024 คาดว่าจำนวนผู้ช่วยเสียงดิจิทัลจะถึง 8.4 พันล้าน หน่วย – มากกว่าประชากรโลก

ตลาดและตลาด

คาดการณ์ว่าขนาดตลาดแอปพลิเคชันผู้ช่วยเสียงจะเพิ่มขึ้นจาก $ 2.8 พันล้าน ใน 2021 ถึง $ 11.2 พันล้าน ในปี 2026 ด้วยอัตรา CAGR 32.4%

Wake Word คืออะไรและตัวอย่างคืออะไร 

คำปลุก (Wake word) คือคำหรือวลีเฉพาะ เช่น 'Hey Siri', 'Okay Google' และ 'Alexa' ที่ออกแบบมาเพื่อกระตุ้นอุปกรณ์สั่งงานด้วยเสียงให้ตอบสนองเมื่อออกเสียง อย่างไรก็ตาม คำปลุกที่รับฟังอยู่ตลอดเวลาและผสานรวมเข้ากับอุปกรณ์โดยตรงจะช่วยลดเวลาตอบสนองลงอย่างมาก และเพิ่มความแม่นยำในการระบุและประมวลผลคำปลุก แม้ว่าจะไม่มีการเชื่อมต่ออินเทอร์เน็ตก็ตาม Shaip รวบรวมข้อมูลการฝึกฝนคำปลุกจากกว่า 100 ภาษา สำเนียงที่หลากหลาย กลุ่มอายุ และสภาพแวดล้อมที่มีเสียงรบกวนในโลกแห่งความเป็นจริง เพื่อเพิ่มความแม่นยำในการตรวจจับและลดการทำงานผิดพลาดให้เหลือน้อยที่สุด นอกจากนี้ยังรู้จักกันในชื่อ:

  • คำเรียก
  • คำเปิดใช้งาน
  • คำที่นิยม
  • วลีปลุก
  • วลีการเปิดใช้งาน
  • คำสั่งปลุก
  • คำสั่งการเปิดใช้งาน
  • คำสั่งเสียง
  • การเก็บคำพูด
  • การรวบรวมคำหลัก
  • คอลเลกชันคีย์วลี
  • & มากกว่า….

Shaip สามารถช่วยได้อย่างไร?

ด้วยข้อเสนอของ Shaip การฝึกอบรมคำปลุกที่ฟังตลอดเวลา โมเดลผู้ช่วยเสียงของคุณจะถูกปรับให้ฟังคำปลุกเสมอ แต่จะไม่มีการบันทึกหรือส่งข้อมูลไปยังคลาวด์จริงๆ การเป็นพันธมิตรกับ Shaip ช่วยให้คุณได้เปรียบจากการทำงานร่วมกับผู้เชี่ยวชาญ ด้วยประสบการณ์ที่กว้างขวางของเราในการใช้เทคโนโลยี AI และ ML ในการพัฒนาการฝึกอบรมผู้ช่วยเสียง เราช่วยให้คุณกำจัดความเสี่ยงด้านความเป็นส่วนตัว ปรับปรุงประสบการณ์ผู้ใช้ ลดต้นทุนการพัฒนา และเพิ่มความสามารถในการปรับขนาดได้

การรวบรวมข้อมูลคำพูด

ความสามารถที่สำคัญ

คำปลุกแบบกำหนดเองและมีแบรนด์

คำปลุกแบบกำหนดเองและมีแบรนด์

Shaip สร้างข้อมูลฝึกฝนสำหรับคำสั่งปลุกเสียงที่มีแบรนด์ของคุณโดยเฉพาะ เพื่อให้ลูกค้าพูดชื่อแบรนด์ของคุณ ไม่ใช่ผู้ช่วยเสียงทั่วไป ชุดข้อมูลทุกชุดได้รับการปรับแต่งให้เข้ากับวลีการเปิดใช้งานของคุณอย่างแม่นยำ เสริมสร้างการจดจำแบรนด์ในทุกการโต้ตอบ และรักษาประสบการณ์การสั่งงานด้วยเสียงไว้ภายในระบบนิเวศของคุณเอง

การเก็บรวบรวมข้อมูลบนอุปกรณ์โดยคำนึงถึงความเป็นส่วนตัวเป็นอันดับแรก

การเก็บรวบรวมข้อมูลบนอุปกรณ์โดยคำนึงถึงความเป็นส่วนตัวเป็นอันดับแรก

Shaip รองรับโมเดลคำปลุกที่รับฟังตลอดเวลา ซึ่งทำงานบนอุปกรณ์โดยไม่ต้องบันทึกหรือส่งเสียงไปยังคลาวด์ ข้อมูลการฝึกคำปลุกบนอุปกรณ์ช่วยลดความหน่วง ลดความเสี่ยงด้านความเป็นส่วนตัว และทำให้การตรวจจับทำงานได้อย่างน่าเชื่อถือแม้ไม่มีการเชื่อมต่ออินเทอร์เน็ต

ความหลากหลายทางภาษาและสำเนียง

Shaip รวบรวมเสียงปลุก (wake word) จากกว่า 100 ภาษาและสำเนียงท้องถิ่น เช่น สก็อตแลนด์ แคนาดา ออสเตรเลีย อังกฤษแบบอินเดีย และอื่นๆ อีกมากมาย ทำให้ความแม่นยำในการตรวจจับคงที่ในกลุ่มผู้ใช้ทั่วโลก แทนที่จะลดลงสำหรับผู้ที่ไม่ใช่เจ้าของภาษา

ความทนทานต่อเสียงรบกวนและระยะไกล

ความทนทานต่อเสียงรบกวนและระยะไกล

Shaip สามารถบันทึกข้อมูลคำปลุกในสภาพแวดล้อมที่เงียบสนิท มีเสียงรบกวน ในรถยนต์ กลางแจ้ง และในระยะไกล การฝึกฝนด้วยการเปลี่ยนแปลงทางเสียงในสภาพแวดล้อมจริงช่วยลดการปฏิเสธที่ผิดพลาดเมื่อผู้ใช้พูดจากระยะไกลหรือในสภาพแวดล้อมที่มีเสียงรบกวน

การระบุวลีและการตรวจจับวลีที่ฝังอยู่

นอกเหนือจากคำสั่งปลุกแล้ว Shaip ยังให้ข้อมูลการตรวจจับคำพูดและวลี เพื่อให้อุปกรณ์สามารถประมวลผลคำสั่งภาษาธรรมชาติที่ยาวขึ้นได้ด้วยความหน่วงต่ำ ข้อมูลการตรวจจับคำหลักแบบฝังตัวช่วยสนับสนุนการประมวลผลบนเบราว์เซอร์และบนชิป เพื่อความแม่นยำและความเป็นส่วนตัวสูง

เคล็ดลับที่ทรงคุณค่าเกี่ยวกับวิธีการเลือกคำปลุกที่ถูกต้อง / คำกระตุ้น

เลือกคำที่มีเสียงที่หลากหลาย

หน่วยเสียงต่างๆ โดยทั่วไปจะสร้างลายเซ็นที่ชัดเจนขึ้นและรับรองความถูกต้องแม่นยำยิ่งขึ้นในผลลัพธ์ ดังนั้น ให้เลือกวลีในข้อมูลของคุณที่สร้างเสียงต่างๆ

ใช้คำนำหน้าที่เหมาะสมกับคำพูดของคุณ

ทำให้คำปลุกมีประสิทธิภาพมากขึ้นโดยเติมคำนำหน้าเช่น "สวัสดี" "สวัสดี" "เฮ้" หรือ "ตกลง" มันจะทำให้คำปลุกชัดเจน & ให้แน่ใจว่าไม่มีการจับคู่โดยบังเอิญเกิดขึ้นเมื่อใช้คำเรียกในการพูดปกติ

ใช้ Phonemes เพื่อสร้างคำเรียกของคุณ

ทำให้คำปลุกของคุณเป็นการรวมกันของหน่วยเสียงอย่างน้อยหกหน่วยที่เครื่องมองเห็นได้ง่ายและมนุษย์พูดง่าย ตัวอย่างเช่น "Alexa" มี XNUMX ฟีโนม ขณะที่ "Ok Google" มี XNUMX ฟีโนม

หลีกเลี่ยงการใช้คำเดียว

อย่าทำผิดพลาดโดยใช้คำเดียวเป็นคำปลุกของคุณ คำปลุกต้องยาวพอที่จะชัดเจน

คำที่เรียบง่ายและไม่ซ้ำกัน

ตรวจสอบให้แน่ใจว่าคำกระตุ้นที่คุณสร้างขึ้นต้องเรียบง่ายและไม่ซ้ำกันเพื่อให้สามารถจดจำได้ง่าย

หลีกเลี่ยงวลียาว ๆ

วลีการปลุกที่มีหลายคำที่ยาวขึ้นนั้นยากต่อการออกเสียงและทำให้กระบวนการยากขึ้นโดยไม่จำเป็น

ข้อจำกัดของข้อมูลการฝึก Wake Word

ความสับสนเนื่องจากการใช้คำพูดหลายคำ

แบบจำลองคำปลุกโดยทั่วไปได้รับการฝึกฝนให้รู้จักคำว่าไม่ ของวาจาที่แตกต่างกัน เพื่อให้สามารถตอบสนองต่อคำวิงวอนต่างๆ ได้ อย่างไรก็ตาม การมีคำปลุกที่แตกต่างกันมากเกินไปสามารถเปิดใช้งานท่อส่งคำพูดโดยที่คุณไม่รู้ว่าผู้ใช้พูดคำใด

ผลลัพธ์ที่แม่นยำน้อยลงเนื่องจากสภาพแวดล้อมภายนอก

ปัจจัยต่างๆ เช่น สัญญาณรบกวน ระยะทาง และการผันแปรของสำเนียงและภาษา ทำให้การตรวจจับคำสั่งให้ดำเนินการที่แม่นยำยากขึ้นและซับซ้อนสำหรับโมเดล AI ของคุณ

การสร้างคำปลุกที่ถูกต้องสำหรับแบรนด์ของคุณ

รถไฟ
รถไฟ

ประสบการณ์ของเราในด้านเทคโนโลยีเสียงช่วยให้เราพัฒนาคำปลุกที่ปรับแต่งให้เหมาะกับการฟังเสมอและวลีปลุกของแบรนด์ได้อย่างรวดเร็ว ด้วยการจดจำเสียงควบคู่กับความเข้าใจในการประมวลผลภาษาธรรมชาติ อัลกอริธึม ML ช่วยถอดเสียงคำพูดและดำเนินการคำสั่งเสียงได้อย่างมีประสิทธิภาพ

พัฒนา
พัฒนา

เรามุ่งเน้นที่การพัฒนาการสร้างต้นแบบคำปลุกอย่างรวดเร็วเพื่อให้แน่ใจว่ามีการปรับแต่งคำที่มีตราสินค้า ต้นแบบทำหน้าที่เป็นเครื่องพิสูจน์แนวคิดและช่วยในการฝึกอบรมที่แม่นยำ ออกสู่ตลาดเร็วขึ้น ทดสอบอย่างรวดเร็ว และขจัดความเสี่ยง

ขึ้น
ขึ้น

สัมผัสประสบการณ์การเติบโตอย่างต่อเนื่องและการมีส่วนร่วมของลูกค้าอย่างไม่ขาดสายด้วยผู้ช่วยเสียงที่ยอดเยี่ยม เรามอบความสามารถในการรู้จำคำพูดหลายภาษา เพื่อให้แอปพลิเคชันสามารถระบุคำและวลีได้อย่างแม่นยำแม้ในสภาพแวดล้อมที่มีเสียงรบกวนสูง

การทำความเข้าใจแนวคิดของความหลากหลายของข้อมูล

ความหลากหลายของข้อมูลคืออะไร?

เป็นวิธีการรวบรวมข้อมูลผู้ใช้ที่สำคัญ เช่น ข้อมูลระบุตัวตน ประเทศต้นกำเนิด อายุ เพศ ภาษา สำเนียง ฯลฯ ความหลากหลายของข้อมูลใช้สำหรับปรับปรุงอัลกอริธึมที่มุ่งเน้นผู้ใช้เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น

ข้อมูลมักจะสร้างอคติในตัว ดังนั้น เมื่อเรารวบรวมข้อมูลจากแหล่งที่หลากหลาย ความเอนเอียงในผลลัพธ์จะลดลงอย่างมาก

ต่อไปนี้คือพารามิเตอร์สองสามประการของความหลากหลายของข้อมูลที่ Shaip กล่าวถึงขณะสร้างคำปลุกและคำสั่งการสนทนาอื่นๆ

ความหลากหลายของข้อมูล
เชื้อชาติและเชื้อชาติ ฮินดู, มุสลิม, คริสเตียน, แอฟริกา, ยุโรป
ระดับการศึกษา ระดับปริญญาตรี, บัณฑิต, ปริญญาเอก, ปริญญาโท
ประเทศ จีน ญี่ปุ่น อินเดีย เกาหลี ดูไบ ไนจีเรีย สหรัฐอเมริกา แคนาดา
เพศ ชาย, หญิง
อายุ น้อยกว่า 10 ปี, 10-15 ปี, 15-25 ปี, 25-45 ปี, 45 ปีขึ้นไป
ภาษาที่ใช้ อังกฤษ ญี่ปุ่น ตุรกี จีน ไทย ฮินดี
สภาพสิ่งแวดล้อม เงียบ, มีเสียงดัง, ดนตรีประกอบ, เสียงพื้นหลัง/เสียงพูด, ในร่ม, กลางแจ้ง, โรงละคร, สนามกีฬา, โรงอาหาร, ในรถยนต์, สำนักงาน, ห้างสรรพสินค้า, เสียงรบกวนในบ้าน, บันได, ถนน, ชายทะเล (มีลม)
สำเนียง (อังกฤษ) ภาษาอังกฤษแบบสกอตแลนด์ ภาษาอังกฤษแบบเวลส์ ภาษาอังกฤษแบบไอร์แลนด์ ภาษาอังกฤษแบบแคนาดา ภาษาอังกฤษแบบออสเตรเลีย ภาษาอังกฤษแบบนิวซีแลนด์
สไตล์การพูด ความเร็วเสียง เร็ว/ปกติ/ช้า, ระดับเสียง สูง/ปกติ/เบา, เป็นทางการ/ไม่เป็นทางการ
ตำแหน่งอุปกรณ์ มือถือ, เดสก์ท็อป

อุตสาหกรรมและกรณีการใช้งาน

บ้านอัจฉริยะ / อุปกรณ์อิเล็กทรอนิกส์

ข้อมูลคำสั่งปลุกสำหรับลำโพง โทรทัศน์ และเครื่องใช้ไฟฟ้าที่ต้องเปิดใช้งานทันทีและปฏิเสธเสียงรบกวนจากพื้นหลัง

ยานยนต์และระบบเสียงในรถยนต์

ชุดข้อมูลคำสั่งปลุกที่ทนทานต่อสัญญาณรบกวนและใช้งานได้ในระยะไกล สำหรับผู้ช่วยส่วนตัวแบบแฮนด์ฟรีในห้องโดยสาร

อุปกรณ์สวมใส่และอุปกรณ์ฟังเสียง

ข้อมูลคำสั่งปลุกที่มีขนาดไฟล์เล็ก เหมาะสำหรับอุปกรณ์ที่เปิดใช้งานตลอดเวลาและมีข้อจำกัดด้านแบตเตอรี่

AI สนทนา

ปรับแต่งคำปลุกและข้อมูลคำพูดเพื่อปรับระบบผู้ช่วยให้เข้ากับภาษาและสำเนียงต่างๆ

การดูแลสุขภาพและอุปกรณ์ทางการแพทย์

การจัดเก็บข้อมูลคำสั่งปลุกบนอุปกรณ์โดยคำนึงถึงความเป็นส่วนตัวเป็นอันดับแรก เพื่อการใช้งานแบบแฮนด์ฟรีในสถานพยาบาลและการดูแลผู้ป่วย

หุ่นยนต์และปัญญาประดิษฐ์แบบฝังตัว

ข้อมูลคำสั่งและคำปลุกแบบหลายรูปแบบสำหรับหุ่นยนต์ที่ตอบสนองแบบเรียลไทม์โดยไม่ต้องอาศัยระบบคลาวด์

วิธีการทำงาน

1. กำหนดคำปลุก/ข้อความที่คุณต้องการใช้

Shaip จะทำงานร่วมกับคุณเพื่อเลือกคำปลุกที่ออกเสียงแตกต่างกันอย่างชัดเจนและสอดคล้องกับแบรนด์ รวมถึงกำหนดแนวทางการรวบรวมข้อมูล

2. รวบรวมคำพูดที่หลากหลาย

พนักงานทั่วโลกของ Shaip บันทึกคำปลุกในภาษา สำเนียง อายุ อุปกรณ์ และสภาพแวดล้อมที่มีเสียงรบกวนตามที่ต้องการ

3. ติดป้ายกำกับและตรวจสอบคุณภาพชุดข้อมูล

คำพูดแต่ละคำจะถูกถอดเสียง ติดป้ายกำกับ และตรวจสอบคุณภาพตามเกณฑ์ที่คุณกำหนด

4. จัดเตรียมข้อมูลที่พร้อมสำหรับการฝึกอบรม

Shaip นำเสนอข้อมูลการฝึกฝนคำปลุกที่มีโครงสร้างและควบคุมด้วยนโยบาย ซึ่งจัดรูปแบบให้เหมาะสมกับไปป์ไลน์โมเดลของคุณ

ทำไมต้องไช่ป์

ในการปรับใช้ความคิดริเริ่ม AI ของคุณอย่างมีประสิทธิภาพ คุณจะต้องมีชุดข้อมูลการฝึกอบรมเฉพาะทางจำนวนมาก Shaip เป็นหนึ่งในบริษัทเพียงไม่กี่แห่งในตลาดที่รับรองข้อมูลการฝึกอบรมระดับโลกและเชื่อถือได้ตามขนาดที่สอดคล้องกับข้อกำหนดด้านกฎระเบียบ/ GDPR

ความสามารถในการรวบรวมข้อมูล

สร้าง ดูแล และรวบรวมชุดข้อมูลที่สร้างขึ้นเอง (ข้อความ คำพูด รูปภาพ วิดีโอ) จากกว่า 100 ประเทศทั่วโลกตามหลักเกณฑ์ที่กำหนดเอง

แรงงานที่ยืดหยุ่น

ใช้ประโยชน์จากพนักงานทั่วโลกของเรามากกว่า 30,000+ ผู้มีส่วนร่วมที่มีประสบการณ์และได้รับการรับรอง การมอบหมายงานที่ยืดหยุ่นและกำลังคนแบบเรียลไทม์ ประสิทธิภาพ และการตรวจสอบความคืบหน้า

คุณภาพ​

แพลตฟอร์มที่เป็นกรรมสิทธิ์ของเราและพนักงานที่มีทักษะใช้วิธีการควบคุมคุณภาพหลายวิธีเพื่อให้เป็นไปตามหรือเกินมาตรฐานคุณภาพที่กำหนดไว้สำหรับการเก็บรวบรวมชุดข้อมูลการฝึกอบรม AI

หลากหลาย แม่นยำ และรวดเร็ว

กระบวนการของเราคล่องตัว กระบวนการรวบรวมผ่านการกระจายงานที่ง่ายขึ้น การจัดการ และการเก็บข้อมูลโดยตรงจากแอพและเว็บอินเตอร์เฟส

ความปลอดภัยของข้อมูล

รักษาความลับของข้อมูลทั้งหมดโดยให้ความสำคัญกับความเป็นส่วนตัวของเรา เรารับรองว่ารูปแบบข้อมูลจะถูกควบคุมและรักษาไว้ตามนโยบาย

ความจำเพาะของโดเมน

ข้อมูลเฉพาะโดเมนที่รวบรวมจากแหล่งข้อมูลเฉพาะอุตสาหกรรมตามหลักเกณฑ์การรวบรวมข้อมูลของลูกค้า

ลูกค้าที่แนะนำ

มอบอำนาจให้ทีมสร้างผลิตภัณฑ์ AI ชั้นนำระดับโลก

Google ไมโครซอฟท์ บริการเว็บอเมซอน

การใช้ AI เพื่อปรับปรุงประสิทธิภาพของธุรกิจผ่านประสบการณ์ของลูกค้า

คำปลุก (Wake word) คือคำหรือวลีเฉพาะ เช่น “Alexa,” “Okay Google” หรือวลีที่กำหนดเองตามแบรนด์ ซึ่งจะเปิดใช้งานอุปกรณ์ที่สั่งงานด้วยเสียงและเปลี่ยนโหมดการฟังจากแบบพาสซีฟเป็นแบบแอคทีฟ อุปกรณ์จะคอยฟังคำปลุกอยู่ตลอดเวลา และจะเริ่มประมวลผลคำขอเมื่อตรวจพบคำปลุกแล้วเท่านั้น

ข้อมูลฝึกคำปลุก (Wake word training data) คือชุดบันทึกเสียงพูดที่มีการติดป้ายกำกับไว้ ซึ่งใช้ในการสอนโมเดลให้จดจำวลีที่ใช้ในการกระตุ้นการทำงาน ข้อมูลฝึกคำปลุกที่มีประสิทธิภาพควรครอบคลุมผู้พูดหลายกลุ่ม สำเนียงหลากหลาย อายุต่างกัน อุปกรณ์ต่างกัน และสภาพแวดล้อมที่มีเสียงรบกวนต่างกัน เพื่อให้โมเดลสามารถทำงานได้อย่างน่าเชื่อถือ ในขณะเดียวกันก็สามารถคัดกรองเสียงพูดที่คล้ายคลึงกันออกไปได้

คำปลุกทำงานโดยใช้โมเดลตรวจจับขนาดเล็กที่คอยฟังอยู่ตลอดเวลา เพื่อสแกนเสียงที่เข้ามาหาคำเป้าหมาย เมื่อโมเดลจับคู่คำปลุกได้ด้วยความมั่นใจที่เพียงพอ อุปกรณ์จะเปิดใช้งานและเริ่มประมวลผลคำขอของผู้ใช้โดยใช้การรู้จำเสียงพูดและการประมวลผลภาษาธรรมชาติ

คำปลุกแบบกำหนดเองที่ดีควรใช้หน่วยเสียงที่หลากหลาย มีอย่างน้อยสามถึงสี่พยางค์ และหลีกเลี่ยงคำทั่วไปในชีวิตประจำวันเพื่อลดการเปิดใช้งานผิดพลาด การเพิ่มคำนำหน้า เช่น “Hey” หรือ “OK” จะช่วยเพิ่มความโดดเด่น Shaip ช่วยในการเลือกและตรวจสอบคำปลุกระหว่างการตั้งค่าโครงการ

ใช่แล้ว การตรวจจับคำสั่งปลุกบนอุปกรณ์จะเรียกใช้โมเดลการเปิดใช้งานในเครื่อง ดังนั้นจึงไม่มีการบันทึกหรือส่งเสียงไปยังคลาวด์ ซึ่งจะช่วยลดความหน่วง ป้องกันความเป็นส่วนตัว และทำให้การตรวจจับทำงานได้แบบออฟไลน์ Shaip รวบรวมข้อมูลการฝึกอบรมที่เหมาะสมกับการใช้งานบนอุปกรณ์และระบบฝังตัวโดยเฉพาะ

Shaip รวบรวมข้อมูลการฝึกฝนคำปลุกในกว่า 100 ภาษาและสำเนียงท้องถิ่นที่หลากหลาย โดยมาจากทีมงานทั่วโลกในกว่า 100 ประเทศ ความครอบคลุมนี้ช่วยลดช่องว่างด้านความแม่นยำสำหรับผู้ที่ไม่ใช่เจ้าของภาษาและสนับสนุนการเปิดตัวผลิตภัณฑ์ทั่วโลก

Shaip ใช้กระบวนการควบคุมคุณภาพหลายขั้นตอน ได้แก่ การตรวจสอบการถอดเสียง เกณฑ์การยอมรับ และการตรวจสอบการทำงานของบุคลากร เพื่อให้ชุดข้อมูลมีความแม่นยำตามเป้าหมายก่อนส่งมอบ ข้อมูลที่หลากหลายและมีคุณภาพสูงช่วยลดอัตราการยอมรับผิดพลาดและการปฏิเสธผิดพลาดในแบบจำลองที่นำไปใช้งาน

คำปลุกจะเปิดใช้งานอุปกรณ์ ส่วนคำพูดคือคำขอที่พูดตามมา การตรวจจับคำปลุกเป็นงานเฉพาะทางที่ต้องทำงานตลอดเวลา ในขณะที่การทำความเข้าใจคำพูดเกี่ยวข้องกับการตีความถ้อยคำภาษาธรรมชาติที่หลากหลาย Shaip ให้ข้อมูลสำหรับการฝึกฝนทั้งการตรวจจับคำปลุกและการรวบรวมคำพูด

คำพูด คือวลีที่ผู้ใช้พูดเพื่อสั่งการซอฟต์แวร์สั่งการด้วยเสียง ซอฟต์แวร์จะระบุเจตนาของผู้ใช้จากคำพูดและตอบสนองตามนั้น ต่างจากประโยคที่สมบูรณ์ คำพูดเป็นหน่วยของคำพูดที่อาจไม่ได้สื่อถึงความคิดทั้งหมดและมักมีช่วงหยุด ตัวอย่างเช่น “แสดงภาพยนตร์เรื่องล่าสุดให้ฉันดู — เรื่องที่เข้าฉายเมื่อสัปดาห์ที่แล้ว” หรือ “ร้านค้าบนถนนสายที่ 22 เปิดอยู่ไหม”

ชื่อเรียกใช้งานคือคำหลักที่ใช้ในการเรียกใช้ "ทักษะ" เฉพาะในซอฟต์แวร์เสียง โดยอาจรวมถึงชื่อบุคคลหรือสถานที่ และอาจรวมกับคำลงท้าย คำสั่ง หรือคำถาม ทักษะที่กำหนดเองทุกทักษะจำเป็นต้องมีชื่อเรียกใช้งานเพื่อเริ่มต้นใช้งาน

คำปลุก (Wake words) เรียกอีกอย่างว่า คำกระตุ้น (trigger words), คำร้อน (hot words), คำเปิดใช้งาน (activation words), คำอัญเชิญ (invocation words), วลีปลุก (wake phrases) และคำเปล่งเสียง (utterances)

อเล็กซ่าใช้ไมโครโฟนในตัวหลายตัวเพื่อตรวจจับคำปลุกพร้อมทั้งกรองเสียงรบกวนรอบข้าง เพื่อป้องกันการตรวจจับผิดพลาด อเล็กซ่าจะเริ่มฟังอย่างจริงจังก็ต่อเมื่อตรวจพบคำว่า “อเล็กซ่า” เท่านั้น