วิสัยทัศน์คอมพิวเตอร์

22+ ชุดข้อมูลโอเพ่นซอร์สที่ได้รับการร้องขอมากที่สุดสำหรับ Computer Vision

อัลกอริทึม AI นั้นดีพอๆ กับข้อมูลที่คุณป้อนเท่านั้น

ไม่ใช่ข้อความที่เป็นตัวหนาหรือแหกกฎ เมื่อสองสามทศวรรษก่อน AI อาจดูเหมือนเป็นเรื่องที่ค่อนข้างจะห่างไกล แต่ปัญญาประดิษฐ์และการเรียนรู้ของเครื่องจักรมาไกลมากตั้งแต่นั้นเป็นต้นมา

วิสัยทัศน์คอมพิวเตอร์ ช่วยให้คอมพิวเตอร์เข้าใจและตีความฉลากและรูปภาพ เมื่อคุณฝึกคอมพิวเตอร์โดยใช้ภาพประเภทที่เหมาะสม คอมพิวเตอร์จะสามารถตรวจจับ ทำความเข้าใจ และระบุลักษณะใบหน้าต่างๆ ตรวจหาโรค ขับรถอัตโนมัติ และช่วยชีวิตได้โดยใช้การสแกนอวัยวะหลายมิติ

ตลาดคอมพิวเตอร์วิทัศน์คาดว่าจะถึง $ 144.46 พันล้าน ภายในปี 2028 จาก 7.04 พันล้านดอลลาร์ในปี 2020 ซึ่งเติบโตที่ CAGR 45.64% ระหว่างปี 2021 ถึง 2028

บางกรณีการใช้งานของการมองเห็นด้วยคอมพิวเตอร์คือ:

  • ภาพทางการแพทย์
  • ยานพาหนะที่เป็นอิสระ
  • การจดจำใบหน้าและวัตถุ
  • การระบุข้อบกพร่อง
  • การตรวจจับฉาก

พื้นที่ ชุดข้อมูลภาพ คุณกำลังป้อนและฝึกอบรมแมชชีนเลิร์นนิงและงานวิชันซิสเต็มของคุณมีความสำคัญต่อความสำเร็จของโครงการ AI ของคุณ ชุดข้อมูลที่มีคุณภาพค่อนข้างหายาก ขึ้นอยู่กับความซับซ้อนของโครงการของคุณ อาจใช้เวลาระหว่างสองสามวันถึงสองสามสัปดาห์เพื่อให้ได้ชุดข้อมูลที่เชื่อถือได้และมีความเกี่ยวข้องสำหรับวัตถุประสงค์ในการมองเห็นด้วยคอมพิวเตอร์

ที่นี่ เราจัดเตรียมชุดข้อมูลโอเพนซอร์ซช่วง (จัดหมวดหมู่ไว้เพื่อความสะดวกของคุณ) ที่คุณสามารถใช้ได้ทันที

รายการที่ครอบคลุมของชุดข้อมูล Computer Vision

ทั่วไป:

  1. อิมเมจเน็ต (ลิงค์)

    ImageNet เป็นชุดข้อมูลที่ใช้กันอย่างแพร่หลาย และมาพร้อมกับภาพที่น่าอัศจรรย์ 1.2 ล้านภาพที่จัดประเภทเป็น 1000 หมวดหมู่ ชุดข้อมูลนี้ได้รับการจัดระเบียบตามลำดับชั้นของ WorldNet และแบ่งออกเป็นสามส่วน ได้แก่ ข้อมูลการฝึก ป้ายกำกับรูปภาพ และข้อมูลการตรวจสอบ

  2. จลนศาสตร์ 700 (ลิงค์)

    Kinetics 700 เป็นชุดข้อมูลคุณภาพสูงขนาดใหญ่ที่มีคลิปมากกว่า 650,000 คลิปจาก 700 คลาสการกระทำของมนุษย์ที่แตกต่างกัน กิจกรรมในชั้นเรียนแต่ละรายการมีวิดีโอคลิปประมาณ 700 คลิป คลิปในชุดข้อมูลมีปฏิสัมพันธ์ระหว่างมนุษย์กับวัตถุและระหว่างมนุษย์กับมนุษย์ ซึ่งพิสูจน์แล้วว่ามีประโยชน์มากเมื่อรับรู้ถึงการกระทำของมนุษย์ในวิดีโอ

  3. ซิฟาร์ -10 (ลิงค์)

    CIFAR 10 เป็นหนึ่งในชุดข้อมูลคอมพิวเตอร์วิทัศน์ที่ใหญ่ที่สุดซึ่งมีภาพสี 60000 32 x 32 แสดงถึงสิบคลาสที่แตกต่างกัน แต่ละชั้นมีรูปภาพประมาณ 6000 ภาพที่ใช้เพื่อฝึกอัลกอริธึมการมองเห็นด้วยคอมพิวเตอร์และแมชชีนเลิร์นนิง

การจดจำใบหน้า:

จดจำใบหน้า

  1. ติดป้ายใบหน้าในป่า (ลิงค์)

    Labeled Faced in the Wild เป็นชุดข้อมูลขนาดใหญ่ที่มีรูปภาพมากกว่า 13,230 ภาพจากผู้คนเกือบ 5,750 คนที่ตรวจพบจากอินเทอร์เน็ต ชุดข้อมูลของใบหน้านี้ออกแบบมาเพื่อให้ศึกษาการตรวจจับใบหน้าแบบไม่มีข้อจำกัดได้ง่ายขึ้น

  2. CASIA เว็บเฟซ (ลิงค์)

    CASIA Web face เป็นชุดข้อมูลที่ได้รับการออกแบบมาอย่างดี ซึ่งช่วยให้การเรียนรู้ของเครื่องและการวิจัยทางวิทยาศาสตร์เกี่ยวกับการจดจำใบหน้าไม่มีข้อจำกัด ด้วยภาพมากกว่า 494,000 ภาพจากข้อมูลระบุตัวตนเกือบ 10,000 รายการ จึงเหมาะอย่างยิ่งสำหรับการระบุใบหน้าและงานตรวจสอบ

  3. UMD ใบหน้าชุดข้อมูล (ลิงค์)

    UMD เผชิญกับชุดข้อมูลที่มีคำอธิบายประกอบอย่างดีซึ่งประกอบด้วยสองส่วน ได้แก่ ภาพนิ่งและเฟรมวิดีโอ ชุดข้อมูลนี้มีคำอธิบายประกอบใบหน้ามากกว่า 367,800 รายการและเฟรมวิดีโอที่มีคำอธิบายประกอบ 3.7 ล้านรายการ

การรู้จำลายมือ:

  1. ฐานข้อมูล MNIST (ลิงค์)

    MNIST เป็นฐานข้อมูลที่มีตัวอย่างตัวเลขที่เขียนด้วยลายมือตั้งแต่ 0 ถึง 9 และมีรูปภาพการฝึกอบรมและทดสอบ 60,000 และ 10,000 ภาพ เปิดตัวในปี 1999 MNIST ช่วยให้ทดสอบระบบประมวลผลภาพในการเรียนรู้เชิงลึกได้ง่ายขึ้น

  2. ชุดข้อมูลอักขระประดิษฐ์ (ลิงค์)

    ชุดข้อมูลอักขระประดิษฐ์เป็นข้อมูลที่สร้างขึ้นเทียมตามชื่อซึ่งอธิบายโครงสร้างภาษาอังกฤษด้วยตัวพิมพ์ใหญ่สิบตัว มาพร้อมกับภาพมากกว่า 6000 ภาพ

มาพูดถึงความต้องการข้อมูลการฝึกอบรม AI ของคุณวันนี้

การตรวจจับวัตถุ:

  1. เอ็มเอส โคโค่ (ลิงค์)

    MS COCO หรือ Common Objects ในบริบทคือชุดข้อมูลการตรวจหาอ็อบเจ็กต์และคำอธิบายภาพ

    มีรูปภาพมากกว่า 328,000 รูปพร้อมการตรวจจับจุดสำคัญ การตรวจจับหลายออบเจ็กต์ คำอธิบายประกอบ และคำอธิบายประกอบมาสก์การแบ่งส่วน มันมาพร้อมกับ 80 หมวดหมู่วัตถุและห้าคำบรรยายต่อภาพ

  2. ลส(ลิงค์)

    LSUN ย่อมาจาก Large-scale Scene Understanding มีภาพติดป้ายกำกับมากกว่าหนึ่งล้านภาพใน 20 วัตถุและ 10 หมวดหมู่ฉาก บางหมวดหมู่มีรูปภาพเกือบ 300,000 รูป โดยมีรูปภาพ 300 รูปสำหรับการตรวจสอบโดยเฉพาะ และรูปภาพ 1000 รูปสำหรับข้อมูลทดสอบ

  3. หน้าแรก วัตถุ(ลิงค์)

    ชุดข้อมูล Home Objects ประกอบด้วยรูปภาพที่มีคำอธิบายประกอบของวัตถุแบบสุ่มจากรอบๆ บ้าน เช่น ห้องครัว ห้องนั่งเล่น และห้องน้ำ ชุดข้อมูลนี้ยังมีวิดีโอที่มีคำอธิบายประกอบสองสามภาพและรูปภาพที่ไม่มีคำอธิบายประกอบ 398 รูปที่ออกแบบมาสำหรับการทดสอบ

ยานยนต์:

  1. ชุดข้อมูลทิวทัศน์เมือง (ลิงค์)

    Cityscape เป็นชุดข้อมูลที่ต้องดูเมื่อค้นหาซีเควนซ์วิดีโอต่างๆ ที่บันทึกจากฉากถนนของแหล่งอ้างอิงต่างๆ ภาพเหล่านี้ถูกถ่ายไว้เป็นเวลานานในสภาพอากาศและสภาพแสงที่แตกต่างกัน คำอธิบายประกอบสำหรับรูปภาพ 30 คลาส แบ่งออกเป็น XNUMX หมวดหมู่ที่แตกต่างกัน

  2. บาร์คลีย์ดีพไดรฟ์ (ลิงค์)

    Barkley DeepDrive ได้รับการออกแบบมาโดยเฉพาะสำหรับการฝึกยานพาหนะที่เป็นอิสระ และมีลำดับวิดีโอที่มีคำอธิบายประกอบมากกว่า 100 รายการ เป็นหนึ่งในข้อมูลการฝึกอบรมที่เป็นประโยชน์มากที่สุดสำหรับยานยนต์ไร้คนขับจากการเปลี่ยนแปลงของถนนและสภาพการขับขี่

  3. มาพิลลารี (ลิงค์)

    Mapillary มีฉากถนนและป้ายจราจรมากกว่า 750 ล้านแห่งทั่วโลก ซึ่งมีประโยชน์มากในการฝึกโมเดลการรับรู้ด้วยภาพในการเรียนรู้ของเครื่องและอัลกอริธึม AI ช่วยให้คุณพัฒนายานยนต์ไร้คนขับที่ตอบสนองแสงและสภาพอากาศและมุมมองที่หลากหลาย

ถ่ายภาพทางการแพทย์:

  1. ชุดข้อมูลการวิจัยแบบเปิดของ Covid-19 (ลิงค์)

    ชุดข้อมูลดั้งเดิมนี้มีการแบ่งส่วนปอดหลายเหลี่ยมประมาณ 6500 พิกเซลเกี่ยวกับการเอ็กซ์เรย์ทรวงอก AP/PA นอกจากนี้ยังมีภาพเอ็กซ์เรย์ผู้ป่วยโควิด-517 จำนวน 19 ภาพ พร้อมแท็กที่มีชื่อ สถานที่ รายละเอียดการรับเข้าเรียน ผลลัพธ์ และอื่นๆ อีกมากมาย

  2. ฐานข้อมูล NIH ของการเอ็กซ์เรย์ทรวงอก 100,000 ครั้ง (ลิงค์)

    ฐานข้อมูล NIH เป็นหนึ่งในชุดข้อมูลสาธารณะที่กว้างขวางที่สุดซึ่งมีภาพเอ็กซ์เรย์ทรวงอก 100,000 ภาพและข้อมูลที่เกี่ยวข้องซึ่งเป็นประโยชน์สำหรับชุมชนวิทยาศาสตร์และการวิจัย และยังมีภาพผู้ป่วยโรคปอดขั้นสูงอีกด้วย

  3. Atlas ของพยาธิวิทยาดิจิทัล (ลิงค์)

    Atlas of Digital Pathology นำเสนอภาพทางจุลพยาธิวิทยาหลายภาพ รวมกว่า 17,000 ภาพ จากสไลด์อวัยวะต่างๆ ที่มีคำอธิบายประกอบเกือบ 100 ภาพ ชุดข้อมูลนี้มีประโยชน์ในการพัฒนาคอมพิวเตอร์วิทัศน์และซอฟต์แวร์การรู้จำรูปแบบ

การจดจำฉาก:

การจดจำฉาก

  1. การจดจำฉากในร่ม (ลิงค์)

    Indoor Scene Recognition เป็นชุดข้อมูลที่มีการจัดหมวดหมู่สูง โดยมีภาพวัตถุและทิวทัศน์ในร่มเกือบ 15620 ภาพเพื่อใช้ในการเรียนรู้ของเครื่องและการฝึกอบรมข้อมูล มีหมวดหมู่มากกว่า 65 หมวดหมู่ และแต่ละหมวดหมู่มีรูปภาพขั้นต่ำ 100 ภาพ

  2. xView (ลิงค์)

    ในฐานะที่เป็นหนึ่งในชุดข้อมูลสาธารณะที่รู้จักกันดีที่สุด xView มีภาพโอเวอร์เฮดที่มีคำอธิบายประกอบจำนวนมากจากฉากที่ซับซ้อนและขนาดใหญ่ต่างๆ ชุดข้อมูลนี้มีประมาณ 60 คลาสและอินสแตนซ์อ็อบเจ็กต์มากกว่าหนึ่งล้านรายการ จุดประสงค์ของชุดข้อมูลนี้คือเพื่อให้การบรรเทาภัยพิบัติดีขึ้นโดยใช้ภาพถ่ายดาวเทียม

  3. สถานที่ (ลิงค์)

    Places ซึ่งเป็นชุดข้อมูลที่สนับสนุนโดย MIT มีรูปภาพมากกว่า 1.8 ล้านภาพจาก 365 หมวดหมู่ฉากต่างๆ แต่ละหมวดหมู่มีรูปภาพประมาณ 50 รูปสำหรับการตรวจสอบและรูปภาพสำหรับการทดสอบ 900 รูป การเรียนรู้คุณสมบัติฉากลึกเพื่อสร้างการจดจำฉากหรือการจดจำภาพเป็นไปได้

บันเทิง:

  1. IMDB WIKI ชุดข้อมูล (ลิงค์)

    IMDB – Wiki เป็นหนึ่งในฐานข้อมูลสาธารณะที่ได้รับความนิยมมากที่สุดสำหรับใบหน้าที่มีป้ายกำกับตามอายุ เพศ และชื่ออย่างเพียงพอ นอกจากนี้ยังมีคนดังประมาณ 20 ใบหน้าและ 62 คนจากวิกิพีเดีย

  2. ใบหน้าดารา (ลิงค์)

    Celeb Faces เป็นฐานข้อมูลขนาดใหญ่ที่มีรูปภาพของคนดังที่มีคำอธิบายประกอบ 200,000 ภาพ รูปภาพมาพร้อมกับเสียงรบกวนพื้นหลังและรูปแบบการโพสท่าต่างๆ ทำให้มีค่าสำหรับชุดทดสอบการฝึกอบรมในงานวิชันซิสเต็ม เป็นประโยชน์อย่างมากในการบรรลุความแม่นยำที่สูงขึ้นในการจดจำใบหน้า การแก้ไข การแปลส่วนใบหน้า และอื่นๆ

ตอนนี้คุณมีรายการชุดข้อมูลภาพโอเพนซอร์ซจำนวนมากเพื่อใช้เป็นเชื้อเพลิงให้กับเครื่องจักรปัญญาประดิษฐ์ของคุณ ผลลัพธ์ของโมเดล AI และแมชชีนเลิร์นนิงขึ้นอยู่กับคุณภาพของชุดข้อมูลที่คุณป้อนและฝึกฝนเป็นหลัก หากคุณต้องการให้โมเดล AI ของคุณคาดการณ์ได้อย่างแม่นยำ จำเป็นต้องมีชุดข้อมูลคุณภาพที่รวบรวม แท็ก และติดป้ายกำกับให้สมบูรณ์แบบ ในการขยายความสำเร็จของระบบการมองเห็นด้วยคอมพิวเตอร์ของคุณ คุณต้องใช้ฐานข้อมูลภาพที่มีคุณภาพที่เกี่ยวข้องกับวิสัยทัศน์ของโครงการของคุณ หากคุณกำลังมองหาชุดข้อมูลดังกล่าวเพิ่มเติม คลิกที่นี่

แบ่งปันสังคม

คุณอาจจะชอบ