อัลกอริทึม AI นั้นดีพอๆ กับข้อมูลที่คุณป้อนเท่านั้น
ไม่ใช่ข้อความที่เป็นตัวหนาหรือแหกกฎ เมื่อสองสามทศวรรษก่อน AI อาจดูเหมือนเป็นเรื่องที่ค่อนข้างจะห่างไกล แต่ปัญญาประดิษฐ์และการเรียนรู้ของเครื่องจักรมาไกลมากตั้งแต่นั้นเป็นต้นมา
วิสัยทัศน์คอมพิวเตอร์ ช่วยให้คอมพิวเตอร์เข้าใจและตีความฉลากและรูปภาพ เมื่อคุณฝึกคอมพิวเตอร์โดยใช้ภาพประเภทที่เหมาะสม คอมพิวเตอร์จะสามารถตรวจจับ ทำความเข้าใจ และระบุลักษณะใบหน้าต่างๆ ตรวจหาโรค ขับรถอัตโนมัติ และช่วยชีวิตได้โดยใช้การสแกนอวัยวะหลายมิติ
ตลาดคอมพิวเตอร์วิทัศน์คาดว่าจะถึง $ 144.46 พันล้าน ภายในปี 2028 จาก 7.04 พันล้านดอลลาร์ในปี 2020 ซึ่งเติบโตที่ CAGR 45.64% ระหว่างปี 2021 ถึง 2028
บางกรณีการใช้งานของการมองเห็นด้วยคอมพิวเตอร์คือ:
- ภาพทางการแพทย์
- ยานพาหนะที่เป็นอิสระ
- การจดจำใบหน้าและวัตถุ
- การระบุข้อบกพร่อง
- การตรวจจับฉาก
พื้นที่ ชุดข้อมูลภาพ คุณกำลังป้อนและฝึกอบรมแมชชีนเลิร์นนิงและงานวิชันซิสเต็มของคุณมีความสำคัญต่อความสำเร็จของโครงการ AI ของคุณ ชุดข้อมูลที่มีคุณภาพค่อนข้างหายาก ขึ้นอยู่กับความซับซ้อนของโครงการของคุณ อาจใช้เวลาระหว่างสองสามวันถึงสองสามสัปดาห์เพื่อให้ได้ชุดข้อมูลที่เชื่อถือได้และมีความเกี่ยวข้องสำหรับวัตถุประสงค์ในการมองเห็นด้วยคอมพิวเตอร์
ที่นี่ เราจัดเตรียมชุดข้อมูลโอเพนซอร์ซช่วง (จัดหมวดหมู่ไว้เพื่อความสะดวกของคุณ) ที่คุณสามารถใช้ได้ทันที
รายการที่ครอบคลุมของชุดข้อมูล Computer Vision
ทั่วไป:
อิมเมจเน็ต (ลิงค์)
ImageNet เป็นชุดข้อมูลที่ใช้กันอย่างแพร่หลาย และมาพร้อมกับภาพที่น่าอัศจรรย์ 1.2 ล้านภาพที่จัดประเภทเป็น 1000 หมวดหมู่ ชุดข้อมูลนี้ได้รับการจัดระเบียบตามลำดับชั้นของ WorldNet และแบ่งออกเป็นสามส่วน ได้แก่ ข้อมูลการฝึก ป้ายกำกับรูปภาพ และข้อมูลการตรวจสอบ
จลนศาสตร์ 700 (ลิงค์)
Kinetics 700 เป็นชุดข้อมูลคุณภาพสูงขนาดใหญ่ที่มีคลิปมากกว่า 650,000 คลิปจาก 700 คลาสการกระทำของมนุษย์ที่แตกต่างกัน กิจกรรมในชั้นเรียนแต่ละรายการมีวิดีโอคลิปประมาณ 700 คลิป คลิปในชุดข้อมูลมีปฏิสัมพันธ์ระหว่างมนุษย์กับวัตถุและระหว่างมนุษย์กับมนุษย์ ซึ่งพิสูจน์แล้วว่ามีประโยชน์มากเมื่อรับรู้ถึงการกระทำของมนุษย์ในวิดีโอ
ซิฟาร์ -10 (ลิงค์)
CIFAR 10 เป็นหนึ่งในชุดข้อมูลคอมพิวเตอร์วิทัศน์ที่ใหญ่ที่สุดซึ่งมีภาพสี 60000 32 x 32 แสดงถึงสิบคลาสที่แตกต่างกัน แต่ละชั้นมีรูปภาพประมาณ 6000 ภาพที่ใช้เพื่อฝึกอัลกอริธึมการมองเห็นด้วยคอมพิวเตอร์และแมชชีนเลิร์นนิง
การจดจำใบหน้า:
ติดป้ายใบหน้าในป่า (ลิงค์)
Labeled Faced in the Wild เป็นชุดข้อมูลขนาดใหญ่ที่มีรูปภาพมากกว่า 13,230 ภาพจากผู้คนเกือบ 5,750 คนที่ตรวจพบจากอินเทอร์เน็ต ชุดข้อมูลของใบหน้านี้ออกแบบมาเพื่อให้ศึกษาการตรวจจับใบหน้าแบบไม่มีข้อจำกัดได้ง่ายขึ้น
CASIA เว็บเฟซ (ลิงค์)
CASIA Web face เป็นชุดข้อมูลที่ได้รับการออกแบบมาอย่างดี ซึ่งช่วยให้การเรียนรู้ของเครื่องและการวิจัยทางวิทยาศาสตร์เกี่ยวกับการจดจำใบหน้าไม่มีข้อจำกัด ด้วยภาพมากกว่า 494,000 ภาพจากข้อมูลระบุตัวตนเกือบ 10,000 รายการ จึงเหมาะอย่างยิ่งสำหรับการระบุใบหน้าและงานตรวจสอบ
UMD ใบหน้าชุดข้อมูล (ลิงค์)
UMD เผชิญกับชุดข้อมูลที่มีคำอธิบายประกอบอย่างดีซึ่งประกอบด้วยสองส่วน ได้แก่ ภาพนิ่งและเฟรมวิดีโอ ชุดข้อมูลนี้มีคำอธิบายประกอบใบหน้ามากกว่า 367,800 รายการและเฟรมวิดีโอที่มีคำอธิบายประกอบ 3.7 ล้านรายการ
การรู้จำลายมือ:
ฐานข้อมูล MNIST (ลิงค์)
MNIST เป็นฐานข้อมูลที่มีตัวอย่างตัวเลขที่เขียนด้วยลายมือตั้งแต่ 0 ถึง 9 และมีรูปภาพการฝึกอบรมและทดสอบ 60,000 และ 10,000 ภาพ เปิดตัวในปี 1999 MNIST ช่วยให้ทดสอบระบบประมวลผลภาพในการเรียนรู้เชิงลึกได้ง่ายขึ้น
ชุดข้อมูลอักขระประดิษฐ์ (ลิงค์)
ชุดข้อมูลอักขระประดิษฐ์เป็นข้อมูลที่สร้างขึ้นเทียมตามชื่อซึ่งอธิบายโครงสร้างภาษาอังกฤษด้วยตัวพิมพ์ใหญ่สิบตัว มาพร้อมกับภาพมากกว่า 6000 ภาพ
การตรวจจับวัตถุ:
เอ็มเอส โคโค่ (ลิงค์)
MS COCO หรือ Common Objects ในบริบทคือชุดข้อมูลการตรวจหาอ็อบเจ็กต์และคำอธิบายภาพ
มีรูปภาพมากกว่า 328,000 รูปพร้อมการตรวจจับจุดสำคัญ การตรวจจับหลายออบเจ็กต์ คำอธิบายประกอบ และคำอธิบายประกอบมาสก์การแบ่งส่วน มันมาพร้อมกับ 80 หมวดหมู่วัตถุและห้าคำบรรยายต่อภาพ
ลส(ลิงค์)
LSUN ย่อมาจาก Large-scale Scene Understanding มีภาพติดป้ายกำกับมากกว่าหนึ่งล้านภาพใน 20 วัตถุและ 10 หมวดหมู่ฉาก บางหมวดหมู่มีรูปภาพเกือบ 300,000 รูป โดยมีรูปภาพ 300 รูปสำหรับการตรวจสอบโดยเฉพาะ และรูปภาพ 1000 รูปสำหรับข้อมูลทดสอบ
หน้าแรก วัตถุ(ลิงค์)
ชุดข้อมูล Home Objects ประกอบด้วยรูปภาพที่มีคำอธิบายประกอบของวัตถุแบบสุ่มจากรอบๆ บ้าน เช่น ห้องครัว ห้องนั่งเล่น และห้องน้ำ ชุดข้อมูลนี้ยังมีวิดีโอที่มีคำอธิบายประกอบสองสามภาพและรูปภาพที่ไม่มีคำอธิบายประกอบ 398 รูปที่ออกแบบมาสำหรับการทดสอบ
ยานยนต์:
ชุดข้อมูลทิวทัศน์เมือง (ลิงค์)
Cityscape เป็นชุดข้อมูลที่ต้องดูเมื่อค้นหาซีเควนซ์วิดีโอต่างๆ ที่บันทึกจากฉากถนนของแหล่งอ้างอิงต่างๆ ภาพเหล่านี้ถูกถ่ายไว้เป็นเวลานานในสภาพอากาศและสภาพแสงที่แตกต่างกัน คำอธิบายประกอบสำหรับรูปภาพ 30 คลาส แบ่งออกเป็น XNUMX หมวดหมู่ที่แตกต่างกัน
บาร์คลีย์ดีพไดรฟ์ (ลิงค์)
Barkley DeepDrive ได้รับการออกแบบมาโดยเฉพาะสำหรับการฝึกยานพาหนะที่เป็นอิสระ และมีลำดับวิดีโอที่มีคำอธิบายประกอบมากกว่า 100 รายการ เป็นหนึ่งในข้อมูลการฝึกอบรมที่เป็นประโยชน์มากที่สุดสำหรับยานยนต์ไร้คนขับจากการเปลี่ยนแปลงของถนนและสภาพการขับขี่
มาพิลลารี (ลิงค์)
Mapillary มีฉากถนนและป้ายจราจรมากกว่า 750 ล้านแห่งทั่วโลก ซึ่งมีประโยชน์มากในการฝึกโมเดลการรับรู้ด้วยภาพในการเรียนรู้ของเครื่องและอัลกอริธึม AI ช่วยให้คุณพัฒนายานยนต์ไร้คนขับที่ตอบสนองแสงและสภาพอากาศและมุมมองที่หลากหลาย
ถ่ายภาพทางการแพทย์:
ชุดข้อมูลการวิจัยแบบเปิดของ Covid-19 (ลิงค์)
ชุดข้อมูลดั้งเดิมนี้มีการแบ่งส่วนปอดหลายเหลี่ยมประมาณ 6500 พิกเซลเกี่ยวกับการเอ็กซ์เรย์ทรวงอก AP/PA นอกจากนี้ยังมีภาพเอ็กซ์เรย์ผู้ป่วยโควิด-517 จำนวน 19 ภาพ พร้อมแท็กที่มีชื่อ สถานที่ รายละเอียดการรับเข้าเรียน ผลลัพธ์ และอื่นๆ อีกมากมาย
ฐานข้อมูล NIH ของการเอ็กซ์เรย์ทรวงอก 100,000 ครั้ง (ลิงค์)
ฐานข้อมูล NIH เป็นหนึ่งในชุดข้อมูลสาธารณะที่กว้างขวางที่สุดซึ่งมีภาพเอ็กซ์เรย์ทรวงอก 100,000 ภาพและข้อมูลที่เกี่ยวข้องซึ่งเป็นประโยชน์สำหรับชุมชนวิทยาศาสตร์และการวิจัย และยังมีภาพผู้ป่วยโรคปอดขั้นสูงอีกด้วย
Atlas ของพยาธิวิทยาดิจิทัล (ลิงค์)
Atlas of Digital Pathology นำเสนอภาพทางจุลพยาธิวิทยาหลายภาพ รวมกว่า 17,000 ภาพ จากสไลด์อวัยวะต่างๆ ที่มีคำอธิบายประกอบเกือบ 100 ภาพ ชุดข้อมูลนี้มีประโยชน์ในการพัฒนาคอมพิวเตอร์วิทัศน์และซอฟต์แวร์การรู้จำรูปแบบ
การจดจำฉาก:
การจดจำฉากในร่ม (ลิงค์)
Indoor Scene Recognition เป็นชุดข้อมูลที่มีการจัดหมวดหมู่สูง โดยมีภาพวัตถุและทิวทัศน์ในร่มเกือบ 15620 ภาพเพื่อใช้ในการเรียนรู้ของเครื่องและการฝึกอบรมข้อมูล มีหมวดหมู่มากกว่า 65 หมวดหมู่ และแต่ละหมวดหมู่มีรูปภาพขั้นต่ำ 100 ภาพ
xView (ลิงค์)
ในฐานะที่เป็นหนึ่งในชุดข้อมูลสาธารณะที่รู้จักกันดีที่สุด xView มีภาพโอเวอร์เฮดที่มีคำอธิบายประกอบจำนวนมากจากฉากที่ซับซ้อนและขนาดใหญ่ต่างๆ ชุดข้อมูลนี้มีประมาณ 60 คลาสและอินสแตนซ์อ็อบเจ็กต์มากกว่าหนึ่งล้านรายการ จุดประสงค์ของชุดข้อมูลนี้คือเพื่อให้การบรรเทาภัยพิบัติดีขึ้นโดยใช้ภาพถ่ายดาวเทียม
สถานที่ (ลิงค์)
Places ซึ่งเป็นชุดข้อมูลที่สนับสนุนโดย MIT มีรูปภาพมากกว่า 1.8 ล้านภาพจาก 365 หมวดหมู่ฉากต่างๆ แต่ละหมวดหมู่มีรูปภาพประมาณ 50 รูปสำหรับการตรวจสอบและรูปภาพสำหรับการทดสอบ 900 รูป การเรียนรู้คุณสมบัติฉากลึกเพื่อสร้างการจดจำฉากหรือการจดจำภาพเป็นไปได้
บันเทิง:
IMDB WIKI ชุดข้อมูล (ลิงค์)
IMDB – Wiki เป็นหนึ่งในฐานข้อมูลสาธารณะที่ได้รับความนิยมมากที่สุดสำหรับใบหน้าที่มีป้ายกำกับตามอายุ เพศ และชื่ออย่างเพียงพอ นอกจากนี้ยังมีคนดังประมาณ 20 ใบหน้าและ 62 คนจากวิกิพีเดีย
ใบหน้าดารา (ลิงค์)
Celeb Faces เป็นฐานข้อมูลขนาดใหญ่ที่มีรูปภาพของคนดังที่มีคำอธิบายประกอบ 200,000 ภาพ รูปภาพมาพร้อมกับเสียงรบกวนพื้นหลังและรูปแบบการโพสท่าต่างๆ ทำให้มีค่าสำหรับชุดทดสอบการฝึกอบรมในงานวิชันซิสเต็ม เป็นประโยชน์อย่างมากในการบรรลุความแม่นยำที่สูงขึ้นในการจดจำใบหน้า การแก้ไข การแปลส่วนใบหน้า และอื่นๆ
ตอนนี้คุณมีรายการชุดข้อมูลภาพโอเพนซอร์ซจำนวนมากเพื่อใช้เป็นเชื้อเพลิงให้กับเครื่องจักรปัญญาประดิษฐ์ของคุณ ผลลัพธ์ของโมเดล AI และแมชชีนเลิร์นนิงขึ้นอยู่กับคุณภาพของชุดข้อมูลที่คุณป้อนและฝึกฝนเป็นหลัก หากคุณต้องการให้โมเดล AI ของคุณคาดการณ์ได้อย่างแม่นยำ จำเป็นต้องมีชุดข้อมูลคุณภาพที่รวบรวม แท็ก และติดป้ายกำกับให้สมบูรณ์แบบ ในการขยายความสำเร็จของระบบการมองเห็นด้วยคอมพิวเตอร์ของคุณ คุณต้องใช้ฐานข้อมูลภาพที่มีคุณภาพที่เกี่ยวข้องกับวิสัยทัศน์ของโครงการของคุณ หากคุณกำลังมองหาชุดข้อมูลดังกล่าวเพิ่มเติม คลิกที่นี่