กรณีศึกษา: การกลั่นกรองเนื้อหา
เว็บเอกสารกว่า 30 รายการถูกทิ้งและใส่คำอธิบายประกอบสำหรับการกลั่นกรองเนื้อหา
ที่พยายามรักษาความปลอดภัยพื้นที่ออนไลน์ที่เราเชื่อมต่อและสื่อสาร
เนื่องจากการใช้โซเชียลมีเดียเติบโตอย่างต่อเนื่อง
ปัญหาการกลั่นแกล้งทางอินเทอร์เน็ตได้เกิดขึ้นเป็น
อุปสรรค์สำคัญสำหรับแพลตฟอร์มที่พยายาม
ตรวจสอบพื้นที่ออนไลน์ที่ปลอดภัย ตุปัดตุเป๋
38% ของบุคคลพบสิ่งนี้
การกระทำที่เป็นอันตรายในชีวิตประจำวัน
เน้นความต้องการเร่งด่วนในการประดิษฐ์
แนวทางการกลั่นกรองเนื้อหา
องค์กรในปัจจุบันพึ่งพาการใช้
ปัญญาประดิษฐ์เพื่อแก้ปัญหาที่ยั่งยืน
ปัญหาการกลั่นแกล้งทางอินเทอร์เน็ตในเชิงรุก
ความปลอดภัยทางไซเบอร์:
รายงานการบังคับใช้มาตรฐานชุมชนไตรมาสที่ 4 ของ Facebook เปิดเผย – การดำเนินการกับเนื้อหากลั่นแกล้งและล่วงละเมิด 6.3 ล้านชิ้น โดยมีอัตราการตรวจจับเชิงรุกที่ 49.9%
การศึกษา:
A 2021 จากการศึกษาพบว่า 36.5%
% ของนักเรียนในสหรัฐอเมริกาที่มีอายุระหว่าง 12 & 17 ประสบการณ์การกลั่นแกล้งบนอินเทอร์เน็ตในช่วงเวลาหนึ่งหรือช่วงหนึ่งในระหว่างการศึกษา
ตามรายงานปี 2020 ตลาดโซลูชันการจัดการเนื้อหาทั่วโลกมีมูลค่า 4.07 พันล้านดอลลาร์สหรัฐในปี 2019 และคาดว่าจะสูงถึง 11.94 พันล้านดอลลาร์สหรัฐภายในปี 2027 โดยมี CAGR 14.7%
โซลูชั่นโลกแห่งความจริง
ข้อมูลที่กลั่นกรองการสนทนาทั่วโลก
ลูกค้ากำลังพัฒนาระบบอัตโนมัติที่แข็งแกร่ง
การกลั่นกรองเนื้อหาการเรียนรู้ของเครื่อง
โมเดลสำหรับข้อเสนอ Cloud ซึ่งพวกเขา
กำลังมองหาผู้ให้บริการเฉพาะโดเมนที่
สามารถช่วยเหลือพวกเขาด้วยข้อมูลการฝึกที่ถูกต้อง
ใช้ประโยชน์จากความรู้ที่กว้างขวางของเราในการประมวลผลภาษาธรรมชาติ (NLP) เราช่วยลูกค้าในการรวบรวม จัดหมวดหมู่ และใส่คำอธิบายประกอบในเอกสารมากกว่า 30,000 ฉบับทั้งภาษาอังกฤษและสเปน เพื่อสร้างโมเดลการเรียนรู้ของเครื่องที่มีการควบคุมเนื้อหาแบบอัตโนมัติโดยแยกเป็นสองส่วนเป็นเนื้อหาที่เป็นพิษ ผู้ใหญ่ หรือเนื้อหาทางเพศที่โจ่งแจ้ง หมวดหมู่
ปัญหา
- การขูดเว็บเอกสาร 30,000 ฉบับทั้งภาษาสเปนและภาษาอังกฤษจากโดเมนที่จัดลำดับความสำคัญ
- จัดหมวดหมู่เนื้อหาที่รวบรวมออกเป็นส่วนสั้น กลาง และยาว
- การติดป้ายกำกับข้อมูลที่รวบรวมว่าเป็นเนื้อหาที่เป็นพิษ สำหรับผู้ใหญ่ หรือมีความโจ่งแจ้งทางเพศ
- รับรองคำอธิบายประกอบคุณภาพสูงด้วยความแม่นยำขั้นต่ำ 90%
Solution
- Web Scrapped เอกสาร 30,000 ฉบับสำหรับภาษาสเปนและภาษาอังกฤษจาก BFSI, Healthcare, Manufacturing, Retail เนื้อหาถูกแบ่งออกเป็นเอกสารสั้นกลางและยาวเพิ่มเติม
- ประสบความสำเร็จในการติดป้ายกำกับเนื้อหาที่จัดประเภทว่าเป็นเนื้อหาที่เป็นพิษ เนื้อหาสำหรับผู้ใหญ่ หรือเนื้อหาทางเพศที่โจ่งแจ้ง
- เพื่อให้ได้คุณภาพ 90% Shaip ใช้กระบวนการควบคุมคุณภาพสองชั้น:
» ระดับ 1: การตรวจสอบการรับประกันคุณภาพ: 100% ของไฟล์ที่ต้องตรวจสอบ
» ระดับ 2: การตรวจสอบการวิเคราะห์คุณภาพที่สำคัญ: ทีม CQA ของ Shaips เพื่อประเมิน 15%-20% ของตัวอย่างย้อนหลัง
ผล
ข้อมูลการฝึกอบรมช่วยในการสร้างโมเดล ML การกลั่นกรองเนื้อหาอัตโนมัติที่สามารถให้ผลลัพธ์หลายอย่างที่เป็นประโยชน์สำหรับการรักษาสภาพแวดล้อมออนไลน์ที่ปลอดภัยยิ่งขึ้น ผลลัพธ์ที่สำคัญบางส่วน ได้แก่ :
- ประสิทธิภาพในการประมวลผลข้อมูลจำนวนมหาศาล
- ความสม่ำเสมอในการสร้างความมั่นใจในการบังคับใช้นโยบายการกลั่นกรองอย่างสม่ำเสมอ
- ความสามารถในการปรับขนาดเพื่อปรับให้เข้ากับฐานผู้ใช้และปริมาณเนื้อหาที่เพิ่มขึ้น
- การกลั่นกรองตามเวลาจริงสามารถระบุ &
ลบเนื้อหาที่อาจเป็นอันตรายเมื่อสร้างขึ้น - คุ้มทุนโดยลดการพึ่งพาผู้ดูแลที่เป็นมนุษย์
ตัวอย่างของการกลั่นกรองเนื้อหา
บอกเราว่าเราสามารถช่วยความคิดริเริ่มด้าน AI ครั้งต่อไปของคุณได้อย่างไร