การรวบรวมข้อมูลการฝึกอบรม Wake Word
ลูกค้าที่แนะนำ
มอบอำนาจให้ทีมสร้างผลิตภัณฑ์ AI ชั้นนำระดับโลก
สร้างเกตเวย์ระหว่างคุณและผลิตภัณฑ์เสียงของคุณด้วยคำปลุกที่ถูกต้องและปรับแต่งได้ และเพิ่มความสามารถในการตรวจจับคำของผู้ช่วยเสียงเพื่อช่วยให้คุณนำหน้าคู่แข่ง
ผู้ช่วยเสียงได้เปลี่ยนแปลงวิธีที่ลูกค้าโต้ตอบกับอุปกรณ์ของตนอย่างมาก พวกเขาทำให้ผู้ใช้สามารถสำรวจผลิตภัณฑ์และบริการได้ง่ายขึ้นอย่างรวดเร็วและมีประสิทธิภาพ อย่างไรก็ตาม แอปพลิเคชั่นเสียงกำลังฟังอยู่หรือไม่? ในการทำให้แอปพลิเคชันเหล่านี้อยู่ในไดรฟ์ระดับสูง จำเป็นต้องปลุกและเปลี่ยนจากการฟังแบบพาสซีฟเป็นการฟังแบบแอคทีฟด้วยความช่วยเหลือของ WAKE WORDS 'Alexa' และ "หวัดดี Siri' เป็นคำปลุกยอดนิยมสองคำในโลก
Statista
ภายในปี 2024 คาดว่าจำนวนผู้ช่วยเสียงดิจิทัลจะถึง 8.4 พันล้าน หน่วย – มากกว่าประชากรโลก
ตลาดและตลาด
ขนาดตลาดแอปผู้ช่วยเสียงคาดว่าจะเพิ่มขึ้นจาก 2.8 พันล้านดอลลาร์ในปี 2021 เป็น 11.2 พันล้านดอลลาร์ในปี 2026 ที่ CAGR 32.4%
Wake Word คืออะไรและตัวอย่างคืออะไร
คำปลุกคือคำหรือวลีเฉพาะ เช่น 'หวัดดี Siri', 'โอเค Google' และ 'Alexa'; ออกแบบมาเพื่อเปิดใช้งานอุปกรณ์ที่สั่งงานด้วยเสียงเพื่อตอบสนองเมื่อมีการพูด อย่างไรก็ตาม คำปลุกที่ฟังตลอดเวลาซึ่งรวมเข้ากับอุปกรณ์ภายในเครื่องจะช่วยลดเวลาตอบสนองได้อย่างมาก และเพิ่มการระบุและความแม่นยำในการประมวลผลของคำปลุกแม้ว่าจะไม่ได้เชื่อมต่ออินเทอร์เน็ตก็ตาม พวกเขายังรู้จักในชื่อ:
- คำเรียก
- คำเปิดใช้งาน
- คำที่นิยม
- วลีปลุก
- วลีการเปิดใช้งาน
- คำสั่งปลุก
- คำสั่งการเปิดใช้งาน
- คำสั่งเสียง
- การเก็บคำพูด
- การรวบรวมคำหลัก
- คอลเลกชันคีย์วลี
- & มากกว่า….
Shaip สามารถช่วยได้อย่างไร?
ด้วยข้อเสนอของ Shaip การฝึกอบรมคำปลุกที่ฟังตลอดเวลา โมเดลผู้ช่วยเสียงของคุณจะถูกปรับให้ฟังคำปลุกเสมอ แต่จะไม่มีการบันทึกหรือส่งข้อมูลไปยังคลาวด์จริงๆ การเป็นพันธมิตรกับ Shaip ช่วยให้คุณได้เปรียบจากการทำงานร่วมกับผู้เชี่ยวชาญ ด้วยประสบการณ์ที่กว้างขวางของเราในการใช้เทคโนโลยี AI และ ML ในการพัฒนาการฝึกอบรมผู้ช่วยเสียง เราช่วยให้คุณกำจัดความเสี่ยงด้านความเป็นส่วนตัว ปรับปรุงประสบการณ์ผู้ใช้ ลดต้นทุนการพัฒนา และเพิ่มความสามารถในการปรับขนาดได้
เคล็ดลับที่ทรงคุณค่าเกี่ยวกับวิธีการเลือกคำปลุกที่ถูกต้อง / คำกระตุ้น
เลือกคำที่มีเสียงที่หลากหลาย
หน่วยเสียงต่างๆ โดยทั่วไปจะสร้างลายเซ็นที่ชัดเจนขึ้นและรับรองความถูกต้องแม่นยำยิ่งขึ้นในผลลัพธ์ ดังนั้น ให้เลือกวลีในข้อมูลของคุณที่สร้างเสียงต่างๆ
ใช้คำนำหน้าที่เหมาะสมกับคำพูดของคุณ
ทำให้คำปลุกมีประสิทธิภาพมากขึ้นโดยเติมคำนำหน้าเช่น "สวัสดี" "สวัสดี" "เฮ้" หรือ "ตกลง" มันจะทำให้คำปลุกชัดเจน & ให้แน่ใจว่าไม่มีการจับคู่โดยบังเอิญเกิดขึ้นเมื่อใช้คำเรียกในการพูดปกติ
ใช้ Phonemes เพื่อสร้างคำเรียกของคุณ
ทำให้คำปลุกของคุณเป็นการรวมกันของหน่วยเสียงอย่างน้อยหกหน่วยที่เครื่องมองเห็นได้ง่ายและมนุษย์พูดง่าย ตัวอย่างเช่น "Alexa" มี XNUMX ฟีโนม ขณะที่ "Ok Google" มี XNUMX ฟีโนม
หลีกเลี่ยงการใช้คำเดียว
อย่าทำผิดพลาดโดยใช้คำเดียวเป็นคำปลุกของคุณ คำปลุกต้องยาวพอที่จะชัดเจน
คำที่เรียบง่ายและไม่ซ้ำกัน
ตรวจสอบให้แน่ใจว่าคำกระตุ้นที่คุณสร้างขึ้นต้องเรียบง่ายและไม่ซ้ำกันเพื่อให้สามารถจดจำได้ง่าย
หลีกเลี่ยงวลียาว ๆ
วลีการปลุกที่มีหลายคำที่ยาวขึ้นนั้นยากต่อการออกเสียงและทำให้กระบวนการยากขึ้นโดยไม่จำเป็น
ข้อจำกัดของข้อมูลการฝึก Wake Word
ความสับสนเนื่องจากการใช้คำพูดหลายคำ
แบบจำลองคำปลุกโดยทั่วไปได้รับการฝึกฝนให้รู้จักคำว่าไม่ ของวาจาที่แตกต่างกัน เพื่อให้สามารถตอบสนองต่อคำวิงวอนต่างๆ ได้ อย่างไรก็ตาม การมีคำปลุกที่แตกต่างกันมากเกินไปสามารถเปิดใช้งานท่อส่งคำพูดโดยที่คุณไม่รู้ว่าผู้ใช้พูดคำใด
ผลลัพธ์ที่แม่นยำน้อยลงเนื่องจากสภาพแวดล้อมภายนอก
ปัจจัยต่างๆ เช่น สัญญาณรบกวน ระยะทาง และการผันแปรของสำเนียงและภาษา ทำให้การตรวจจับคำสั่งให้ดำเนินการที่แม่นยำยากขึ้นและซับซ้อนสำหรับโมเดล AI ของคุณ
การสร้างคำปลุกที่ถูกต้องสำหรับแบรนด์ของคุณ
รถไฟ
ประสบการณ์ของเราในด้านเทคโนโลยีเสียงช่วยให้เราพัฒนาคำปลุกที่ปรับแต่งให้เหมาะกับการฟังเสมอและวลีปลุกของแบรนด์ได้อย่างรวดเร็ว ด้วยการจดจำเสียงควบคู่กับความเข้าใจในการประมวลผลภาษาธรรมชาติ อัลกอริธึม ML ช่วยถอดเสียงคำพูดและดำเนินการคำสั่งเสียงได้อย่างมีประสิทธิภาพพัฒนา
เรามุ่งเน้นที่การพัฒนาการสร้างต้นแบบคำปลุกอย่างรวดเร็วเพื่อให้แน่ใจว่ามีการปรับแต่งคำที่มีตราสินค้า ต้นแบบทำหน้าที่เป็นเครื่องพิสูจน์แนวคิดและช่วยในการฝึกอบรมที่แม่นยำ ออกสู่ตลาดเร็วขึ้น ทดสอบอย่างรวดเร็ว และขจัดความเสี่ยง
ขึ้น
สัมผัสประสบการณ์การเติบโตอย่างต่อเนื่องและการมีส่วนร่วมของลูกค้าอย่างไม่ขาดสายด้วยผู้ช่วยเสียงที่ยอดเยี่ยม เรามอบความสามารถในการรู้จำคำพูดหลายภาษา เพื่อให้แอปพลิเคชันสามารถระบุคำและวลีได้อย่างแม่นยำแม้ในสภาพแวดล้อมที่มีเสียงรบกวนสูงการออกแบบ การพัฒนา และการปรับใช้อย่างรวดเร็ว
การฝึกอบรม พัฒนา และปรับใช้คำปลุกที่กำหนดเองซึ่งฟังตลอดเวลาไม่จำเป็นต้องยุ่งยากและใช้เวลานาน ด้วยความช่วยเหลือที่เหมาะสมจากผู้เชี่ยวชาญด้านเทคโนโลยีของ Shaip คุณสามารถลดความซับซ้อนและลดเวลาในการเข้าสู่ตลาดได้อย่างมีประสิทธิภาพ นอกจากนี้ ประสบการณ์การเก็บรวบรวมข้อมูล การติดป้ายกำกับ และการทำหมายเหตุประกอบยังช่วยให้คุณได้รับคำปลุกใจภายในไม่กี่สัปดาห์
คุณสมบัติของการฝึกอบรมและการปรับใช้ Wake Words
คำปลุกแบรนด์ที่กำหนดเอง
คำปลุกแบรนด์มักเกี่ยวข้องกับคุณค่าและประสิทธิภาพ ถึงเวลาที่คุณจะใช้ประโยชน์จากประโยชน์มหาศาลของการมีคำปลุกแบรนด์ที่กำหนดเองทำงานเพื่อผลประโยชน์ของคุณ เป็นเจ้าของแบรนด์ของคุณและพัฒนาคำปลุกหรือวลีที่เหมาะกับแบรนด์ของคุณ ที่ Shaip เราสามารถช่วยให้ลูกค้าของคุณใช้ชื่อแบรนด์ของคุณกับทุกการโต้ตอบกับการร่ายมนตร์ของแบรนด์ด้วยผู้ช่วยเสียงของพวกเขา
คำสั่งหรือวลี Spotting
การไปไกลกว่าคำปลุกคือการจำวลี ทำให้ผู้ใช้สามารถใช้ภาษาธรรมชาติเพื่อควบคุมอุปกรณ์ที่สั่งงานด้วยเสียงได้ Shaip มีประสบการณ์มากมายในการช่วยเหลือธุรกิจขนาดเล็กถึงขนาดใหญ่พัฒนาแอปพลิเคชันที่สามารถประมวลผลวลีที่มีความยาวได้โดยไม่มีเวลาแฝงและความแม่นยำที่เพิ่มขึ้น
การตรวจจับคำปลุกหรือวลีที่สำคัญในตัว
นักพัฒนาของ Shaip ช่วยให้แบรนด์ต่างๆ มอบประสบการณ์การใช้เสียงที่ดียิ่งขึ้นแก่ลูกค้าของตนโดยจัดหาการตรวจจับคำหลักหรือวลีที่ฝังไว้ เรารับรองความเป็นส่วนตัว ความหน่วงเป็นศูนย์ และความแม่นยำสูงโดยให้เทคโนโลยีwake word engine ประมวลผลคำปลุกหลายคำภายในเบราว์เซอร์ ไม่ใช่บนคลาวด์
การทำความเข้าใจแนวคิดของความหลากหลายของข้อมูล
ความหลากหลายของข้อมูลคืออะไร?
เป็นวิธีการรวบรวมข้อมูลผู้ใช้ที่สำคัญ เช่น ข้อมูลระบุตัวตน ประเทศต้นกำเนิด อายุ เพศ ภาษา สำเนียง ฯลฯ ความหลากหลายของข้อมูลใช้สำหรับปรับปรุงอัลกอริธึมที่มุ่งเน้นผู้ใช้เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น
ข้อมูลมักจะสร้างอคติในตัว ดังนั้น เมื่อเรารวบรวมข้อมูลจากแหล่งที่หลากหลาย ความเอนเอียงในผลลัพธ์จะลดลงอย่างมาก
ต่อไปนี้คือพารามิเตอร์สองสามประการของความหลากหลายของข้อมูลที่ Shaip กล่าวถึงขณะสร้างคำปลุกและคำสั่งการสนทนาอื่นๆ
เชื้อชาติและเชื้อชาติ | ฮินดู, มุสลิม, คริสเตียน, แอฟริกา, ยุโรป |
ระดับการศึกษา | ระดับปริญญาตรี, บัณฑิต, ปริญญาเอก, ปริญญาโท |
ประเทศ | จีน ญี่ปุ่น อินเดีย เกาหลี ดูไบ ไนจีเรีย สหรัฐอเมริกา แคนาดา |
เพศ | ชาย, หญิง |
อายุ | น้อยกว่า 10 ปี, 10-15, 15-25, 25-45, 45 ปีขึ้นไป |
ภาษา | อังกฤษ ญี่ปุ่น ตุรกี จีน ไทย ฮินดี |
สิ่งแวดล้อม | เงียบ, เสียงดัง, เพลงประกอบ, เสียงพื้นหลังหรือคำพูด, ในอาคาร, กลางแจ้ง, โรงละคร, สนามกีฬา, โรงอาหาร, ในรถยนต์, สำนักงาน, ห้างสรรพสินค้า, เสียงรบกวนจากบ้าน, บันได, ถนน/ถนน, ฝั่งทะเล (ลมแรง) |
สำเนียง (อังกฤษ) | ภาษาอังกฤษแบบสก็อต ภาษาอังกฤษแบบเวลส์ ภาษาอังกฤษแบบฮิเบอร์โน ภาษาอังกฤษแบบแคนาดา ภาษาอังกฤษแบบออสเตรเลีย ภาษาอังกฤษแบบนิวซีแลนด์ |
สไตล์การพูด | เร็ว/ปกติ/ช้า, สูง/ปกติ/เบา, เป็นทางการ/ไม่เป็นทางการ ฯลฯ |
ตำแหน่งอุปกรณ์ | มือถือ, เดสก์ท็อป |
กรณีการใช้งานที่สำคัญ
การค้นหาด้วยเสียง
เพิ่มการค้นหาด้วยเสียงไปยังแอพมือถือ เว็บไซต์ และอุปกรณ์ ค้นหาคำหลักและวลีในเสียง วิดีโอ และสตรีม
ค้นหาแบบแฮนด์ฟรี
เปิดใช้งานซอฟต์แวร์ของคุณเพื่อแสดงผลการค้นหาแบบแฮนด์ฟรีโดยใช้คำสั่งเสียงเพื่อดำเนินการตามที่ตั้งใจไว้
คำสั่งเสียง
เพิ่มคำสั่งเสียงไปยังอุปกรณ์ มือถือ หรือเว็บแอปพลิเคชัน เพื่อยกระดับประสบการณ์ของลูกค้า
การวิเคราะห์คำพูด
แพลตฟอร์ม Voice AI แบบ end-to-end ขับเคลื่อนซอฟต์แวร์ด้วยเครื่องมืออัจฉริยะเพื่อมอบประสบการณ์ที่ยอดเยี่ยมให้กับลูกค้า
ทำไมต้องไช่ป์
ในการปรับใช้ความคิดริเริ่ม AI ของคุณอย่างมีประสิทธิภาพ คุณจะต้องมีชุดข้อมูลการฝึกอบรมเฉพาะทางจำนวนมาก Shaip เป็นหนึ่งในบริษัทเพียงไม่กี่แห่งในตลาดที่รับรองข้อมูลการฝึกอบรมระดับโลกและเชื่อถือได้ตามขนาดที่สอดคล้องกับข้อกำหนดด้านกฎระเบียบ/ GDPR
ความสามารถในการรวบรวมข้อมูล
สร้าง ดูแล และรวบรวมชุดข้อมูลที่สร้างขึ้นเอง (ข้อความ คำพูด รูปภาพ วิดีโอ) จากกว่า 100 ประเทศทั่วโลกตามหลักเกณฑ์ที่กำหนดเอง
แรงงานที่ยืดหยุ่น
ใช้ประโยชน์จากพนักงานทั่วโลกของเรามากกว่า 30,000+ ผู้มีส่วนร่วมที่มีประสบการณ์และได้รับการรับรอง การมอบหมายงานที่ยืดหยุ่นและกำลังคนแบบเรียลไทม์ ประสิทธิภาพ และการตรวจสอบความคืบหน้า
คุณภาพ
แพลตฟอร์มที่เป็นกรรมสิทธิ์ของเราและพนักงานที่มีทักษะใช้วิธีการควบคุมคุณภาพหลายวิธีเพื่อให้เป็นไปตามหรือเกินมาตรฐานคุณภาพที่กำหนดไว้สำหรับการเก็บรวบรวมชุดข้อมูลการฝึกอบรม AI
หลากหลาย แม่นยำ และรวดเร็ว
กระบวนการของเราคล่องตัว กระบวนการรวบรวมผ่านการกระจายงานที่ง่ายขึ้น การจัดการ และการเก็บข้อมูลโดยตรงจากแอพและเว็บอินเตอร์เฟส
ความปลอดภัยของข้อมูล
รักษาความลับของข้อมูลทั้งหมดโดยให้ความสำคัญกับความเป็นส่วนตัวของเรา เรารับรองว่ารูปแบบข้อมูลจะถูกควบคุมและรักษาไว้ตามนโยบาย
ความจำเพาะของโดเมน
ข้อมูลเฉพาะโดเมนที่รวบรวมจากแหล่งข้อมูลเฉพาะอุตสาหกรรมตามหลักเกณฑ์การรวบรวมข้อมูลของลูกค้า
ทรัพยากรที่แนะนำ
การเสนอ
บริการเก็บข้อมูลคำพูดสำหรับ AIs ของคุณ
Shaip นำเสนอบริการรวบรวมข้อมูลเสียงพูด/เสียงแบบ end-to-end ในกว่า 150 ภาษา เพื่อเปิดใช้งานเทคโนโลยีที่เปิดใช้งานเสียงเพื่อรองรับกลุ่มผู้ชมที่หลากหลายทั่วโลก
คู่มือผู้ซื้อ
คู่มือผู้ซื้อสำหรับ AI สนทนา
แชทบอทที่คุณสนทนาด้วยทำงานบนระบบ AI การสนทนาขั้นสูงที่ได้รับการฝึกอบรม ทดสอบ และสร้างโดยใช้ชุดข้อมูลการรู้จำเสียงพูดจำนวนมาก เป็นกระบวนการพื้นฐานเบื้องหลังเทคโนโลยีที่ทำให้เครื่องจักรมีความชาญฉลาด
กรณีศึกษา
คำพูดเพื่อสร้างผู้ช่วยดิจิทัลหลายภาษาใน 13 ภาษา
ความจำเป็นในการฝึกอบรม Utterance เกิดขึ้นเนื่องจากลูกค้าบางรายอาจใช้คำหรือวลีที่แน่นอนในขณะที่โต้ตอบหรือถามคำถามกับผู้ช่วยเสียงในรูปแบบสคริปต์การใช้ AI เพื่อปรับปรุงประสิทธิภาพของธุรกิจผ่านประสบการณ์ของลูกค้า
คำถามที่พบบ่อย (FAQ)
คำปลุกคือวลีที่เปิดใช้งานระบบที่เปิดใช้งานเสียงของคุณและใส่ลงในโหมดการฟังเพื่อรับคำแนะนำจากผู้ใช้
ชื่อการเรียกเป็นคีย์เวิร์ดที่ใช้เรียก "ทักษะ" เฉพาะของซอฟต์แวร์ ชื่อเรียกยังสามารถเป็นชื่อของบุคคลหรือสถานที่ และสามารถใช้ร่วมกับการกระทำ คำสั่ง หรือคำถาม ทักษะที่กำหนดเองทั้งหมดควรมีชื่อเรียกเพื่อเริ่มต้น
คำพูดคือวลีที่ผู้ใช้ใช้เพื่อขอซอฟต์แวร์คำสั่งเสียงของคุณ ซอฟต์แวร์ระบุเจตนาของผู้ใช้จากคำพูดที่ให้มาและตอบสนองตามนั้นต่อไป
การประมวลผลภาษาธรรมชาติหรือ NLP เป็นการบรรจบกันของปัญญาประดิษฐ์และภาษาศาสตร์เชิงคำนวณที่รับผิดชอบในการโต้ตอบระหว่างเครื่องและภาษาธรรมชาติของมนุษย์ ใช้ประโยชน์จากอัลกอริธึม NLP ซอฟต์แวร์จะวิเคราะห์ ทำความเข้าใจ แก้ไข หรือสร้างภาษาธรรมชาติสำหรับโมเดล AI ของคุณ
คำพูดปลุก, คำพูด, คำกระตุ้น, คำร้อน, คำวิงวอน
ประโยคคือกลุ่มของคำที่แสดงความหมายที่สมบูรณ์หรือสื่อถึงความคิดทั้งหมด ประโยคอาจเป็นแบบง่าย ซับซ้อน หรือแบบประสม และสามารถแสดงออกในรูปแบบการเขียนหรือการพูดได้
ในทางกลับกัน คำพูดเป็นหน่วยของคำพูดที่มักจะไม่สื่อความหมายหรือความคิดทั้งหมด และประกอบด้วยการหยุดชั่วคราวและความเงียบ
ตัวอย่างของคำพูด:
- 'ขอนำเสนอ....นี่คือสถิติในภูมิภาค'
- 'ขอดูภาพยนตร์เรื่องล่าสุด......เรื่องที่เพิ่งเข้าฉายไปเมื่อสัปดาห์ที่แล้ว'
- 'ร้านที่ 22 ถนนเปิดแล้วตอนนี้......ร้านข้างธนาคาร'
Alexa มาพร้อมกับไมโครโฟนในตัวหลายตัวที่ตรวจจับและจดจำคำปลุกโดยไม่สนใจเสียงพื้นหลัง เพื่อป้องกันผลลบลวงและผลบวกลวง Alexa ถูกตั้งโปรแกรมให้เปิดการได้ยินหลังจากตรวจพบคำปลุก 'Alexa' เท่านั้น
คำปลุกคือวลีที่ตั้งโปรแกรมไว้ซึ่งทำให้ผู้ช่วยเสียงพูดเริ่มฟังและประมวลผลคำขอของผู้ใช้ ผู้ช่วยเสียงพูดใดๆ จะได้รับการฝึกอบรมเกี่ยวกับการโต้ตอบในโลกแห่งความเป็นจริงโดยใช้ปัญญาประดิษฐ์และการประมวลผลภาษาธรรมชาติ ซึ่งคำพูดจะถูกแปลงเป็นวลี คำ และเสียง