เปิดชุดข้อมูล

ค้นพบชุดข้อมูลโอเพ่นซอร์สที่ให้คุณฝึกโมเดล ML

เปิดชุดข้อมูล

ชุดข้อมูลโอเพนซอร์สเพื่อให้คุณเริ่มต้นใช้งานโมเดล AI/ML

ผลลัพธ์ของโมเดล AI & ML ของคุณนั้นดีพอๆ กับข้อมูลที่คุณใช้ในการฝึกเท่านั้น ดังนั้นความแม่นยำที่คุณใช้กับการรวมข้อมูลและการติดแท็กและการระบุข้อมูลนั้นเป็นสิ่งสำคัญ!

ดังนั้น หากคุณต้องการเริ่มต้นความคิดริเริ่ม AI/ML ใหม่และตอนนี้ คุณตระหนักได้อย่างรวดเร็วว่าการค้นหาข้อมูลการฝึกอบรมคุณภาพสูงจะเป็นหนึ่งในแง่มุมที่ท้าทายมากขึ้นของโครงการของคุณ เนื่องจากชุดข้อมูลคุณภาพสูงเป็นเชื้อเพลิงที่ช่วยให้ AI/ เครื่องยนต์ ML ทำงาน เราได้รวบรวมรายการชุดข้อมูลแบบเปิดที่ใช้งานได้ฟรีและฝึกโมเดล AI/ML ของคุณในอนาคต

ความเชี่ยวชาญประเภทข้อมูลชื่อชุดข้อมูลอุตสาหกรรม / ฝ่ายคำอธิบายประกอบ/กรณีการใช้งานรายละเอียดลิงค์
NLPข้อความรีวิว AmazonE-Commerceการวิเคราะห์ความเชื่อมั่นชุดบทวิจารณ์และการให้คะแนน 35 ล้านรายการในช่วง 18 ปีที่ผ่านมาในรูปแบบข้อความธรรมดาพร้อมรายละเอียดผู้ใช้และผลิตภัณฑ์ลิงค์
NLPข้อความWikipedia ลิงก์ข้อมูลทั่วไปมากกว่า 4 ล้าน บทความที่มี 1.9 พันล้าน คำที่ประกอบด้วยคำและวลีตลอดจนย่อหน้าลิงค์
NLPข้อความสแตนด์ฟอร์ด เซนติเมนท์ ทรีแบงค์ความบันเทิงการวิเคราะห์ความเชื่อมั่นชุดข้อมูลคำอธิบายประกอบความคิดเห็นสำหรับบทวิจารณ์กว่า 10,000 ชิ้นจาก Rotten Tomatoes ในรูปแบบไฟล์ HTMLลิงค์
NLPข้อความTwitter ความเชื่อมั่นของสายการบินสหรัฐฯสายการบินการวิเคราะห์ความเชื่อมั่น2015 ทวีตบน US Airlines แยกออกเป็นโทนบวก ลบ และเป็นกลางลิงค์
CVภาพ อิมเมจเน็ตทั่วไปชุดข้อมูลที่มีมากกว่า 14 ล้าน รูปภาพในรูปแบบไฟล์ต่างๆ จัดระเบียบตามลำดับชั้นของ WordNetลิงค์
CVภาพ รูปภาพเปิดของ Googleทั่วไป9 น. URL สำหรับจัดหมวดหมู่ภาพสาธารณะจากกว่า 6,000 หมวดหมู่ลิงค์
NLPข้อความMIMIC Critical Care ฐานข้อมูลการดูแลสุขภาพชุดข้อมูลสรีรวิทยาเชิงคำนวณพร้อมข้อมูลที่ไม่ระบุตัวตนจากผู้ป่วยวิกฤต 40,000 ราย ชุดข้อมูลประกอบด้วยข้อมูล เช่น ข้อมูลประชากร สัญญาณชีพ ยารักษาโรค ฯลฯลิงค์
CVภาพสำนักงานการท่องเที่ยวและการท่องเที่ยวแห่งชาติสหรัฐอเมริกาการท่องเที่ยวให้ภาพถ่ายกว้างๆ จากอุตสาหกรรมการท่องเที่ยวพร้อมฐานข้อมูลที่น่าเชื่อถือ ครอบคลุมหัวข้อต่างๆ เช่น การเดินทางขาเข้าและขาออก และข้อมูลการท่องเที่ยวระหว่างประเทศลิงค์
NLPข้อความกรมการขนส่งการท่องเที่ยวชุดข้อมูลการท่องเที่ยวที่รวมอุทยานแห่งชาติ ทะเบียนผู้ขับขี่ สะพาน ข้อมูลรถไฟ ฯลฯลิงค์
NLPเสียงคลังคำบรรยายเสียง Flickrทั่วไปคำอธิบายภาพมากกว่า 40 คำบรรยายจากภาพถ่าย 8,000 ภาพที่ออกแบบมาสำหรับรูปแบบคำพูดที่ไม่มีผู้ดูแลลิงค์
NLPเสียงชุดข้อมูลคำสั่งเสียงทั่วไปการรู้จำเสียง คำบรรยายเสียงคำพูดยาว 1 วินาทีจากบุคคลนับพัน เพื่อสร้างอินเทอร์เฟซเสียงพื้นฐานลิงค์
NLPเสียงชุดข้อมูลเสียงสิ่งแวดล้อมทั่วไปสภาพแวดล้อมชุดข้อมูลเสียงที่มีเสียงของตารางเหตุการณ์และตารางฉากอะคูสติกลิงค์
NLPข้อความชุดข้อมูลการวิจัยแบบเปิดของ COVID-19 การดูแลสุขภาพAI ทางการแพทย์ชุดข้อมูลการวิจัยประกอบด้วยบทความวิชาการ 45,000 บทความเกี่ยวกับ COVID-19 และกลุ่มไวรัส coronavirusลิงค์
CVภาพWaymo เปิดชุดข้อมูล ยานยนต์ชุดข้อมูลการขับขี่อัตโนมัติที่หลากหลายที่สุดที่เผยแพร่โดย Waymoลิงค์
CVภาพป้ายชื่อ ภาครัฐชุดรูปภาพที่มีคำอธิบายประกอบขนาดใหญ่เข้าถึงได้ผ่าน Labelme Matlabลิงค์
CVภาพชุดข้อมูล Stanford Dogsทั่วไปรูปภาพมากกว่า 20,500+ ภาพที่จัดอยู่ในชุดรูปภาพของสุนัขต่าง ๆ 120 สายพันธุ์ลิงค์
CVภาพการจดจำฉากในร่มทั่วไปการจดจำฉากชุดข้อมูลเฉพาะที่ประกอบด้วย 15620 ภาพจาก 67 หมวดหมู่ในร่มเพื่อสร้างแบบจำลองการจดจำฉากลิงค์
CVภาพVisualQAทั่วไปชุดข้อมูลที่มีคำถามปลายเปิดที่เกี่ยวข้องกับภาพถ่าย 265,016 รูปที่ต้องใช้ความเข้าใจในการมองเห็นและความเข้าใจในภาษาเพื่อตอบลิงค์
NLPข้อความชุดข้อมูลการวิเคราะห์ความเชื่อมั่นแบบหลายโดเมนE-Commerceการวิเคราะห์ความเชื่อมั่นชุดข้อมูลที่มีการรีวิวสินค้าจาก Amazonลิงค์
NLPข้อความIMDB ความคิดเห็นความบันเทิงการวิเคราะห์ความเชื่อมั่นชุดข้อมูลที่มีบทวิจารณ์ภาพยนตร์ 25000 เรื่องสำหรับการวิเคราะห์ความเชื่อมั่นลิงค์
NLPข้อความบล็อกเกอร์คอร์ปัสทั่วไปการวิเคราะห์คีย์เวิร์ดชุดข้อมูลที่มี 681,288 บล็อกโพสต์จาก blogger.com ซึ่งประกอบด้วยคำภาษาอังกฤษที่ใช้กันอย่างแพร่หลายอย่างน้อย 200 ครั้งลิงค์
NLPข้อความอันตรายทั่วไปการฝึกอบรม Chatbotชุดข้อมูลที่มีคำถามมากกว่า 200,000 ข้อที่สามารถนำมาใช้ฝึกโมเดลการเรียนรู้ของเครื่องให้ตอบสนองอัตโนมัติได้อย่างชาญฉลาดลิงค์
NLPข้อความSMS Spam Collection เป็นภาษาอังกฤษเทเลคอมการจดจำสแปมชุดข้อมูลข้อความสแปมประกอบด้วย SMS ภาษาอังกฤษ 5,574 รายการลิงค์
NLPข้อความYelp ความคิดเห็นทั่วไปการวิเคราะห์ความเชื่อมั่นชุดข้อมูลที่มีบทวิจารณ์มากกว่า 5 ล้านรายการที่เผยแพร่โดย Yelpลิงค์
NLPข้อความสแปมเบสของ UCIEnterpriseการจดจำสแปมชุดข้อมูลอีเมลขยะขนาดใหญ่ มีประโยชน์สำหรับการกรองสแปมลิงค์
CVวิดีโอ, รูปภาพเบิร์กลีย์ ดีพไดรฟ์ BDD100kยานยนต์ยานพาหนะอิสระชุดข้อมูลที่ใหญ่ที่สุดชุดหนึ่งสำหรับ AI ที่ขับเคลื่อนด้วยตนเองซึ่งมีประสบการณ์การขับขี่ 1,100 ชั่วโมงในวิดีโอมากกว่า 100,000 รายการจากช่วงเวลาต่างๆ ของวันจากพื้นที่นิวยอร์กและซานฟรานซิสโกลิงค์
CVวีดีโอจุลภาค.aiยานยนต์ยานพาหนะอิสระ ชุดข้อมูลการขับขี่บนทางหลวง 7 ชั่วโมง ประกอบด้วยข้อมูลความเร็ว ความเร่ง มุมบังคับเลี้ยว และพิกัด GPS ของรถลิงค์
CVวิดีโอ, รูปภาพชุดข้อมูลทิวทัศน์เมืองยานยนต์ฉลากความหมายสำหรับรถยนต์ขับเคลื่อนอัตโนมัติชุดข้อมูลคำอธิบายประกอบระดับ 5,000 พิกเซลพร้อมชุดเฟรมที่ใส่คำอธิบายประกอบไม่แน่นหนา 20,000 เฟรมในลำดับวิดีโอสเตอริโอที่บันทึกจาก 50 เมืองที่แตกต่างกันลิงค์
CVภาพชุดข้อมูลป้ายจราจร KUL เบลเยียมยานยนต์ยานพาหนะอิสระคำอธิบายประกอบเครื่องหมายจราจรมากกว่า 10000 รายการจากภูมิภาคแฟลนเดอร์ส โดยอิงจากสัญญาณจราจรที่แตกต่างกันตามร่างกายจากทั่วเบลเยียมลิงค์
CVภาพLISA: ห้องปฏิบัติการสำหรับรถยนต์อัจฉริยะและปลอดภัย UC San Diego Datasetsยานยนต์ยานพาหนะอิสระชุดข้อมูลที่สมบูรณ์ซึ่งประกอบด้วยป้ายจราจร การตรวจจับยานพาหนะ สัญญาณไฟจราจร และรูปแบบวิถีลิงค์
CVภาพซิฟาร์ -10ทั่วไปการจดจำวัตถุObjectชุดข้อมูลประกอบด้วยภาพ 50,000 ภาพและภาพทดสอบ 10,000 ภาพ (เช่น ภาพสี 60,000 32×32 ใน 10 คลาส) สำหรับการจดจำวัตถุลิงค์
CVภาพแฟชั่น MNISTแฟชั่นชุดข้อมูลรูปภาพที่ประกอบด้วยตัวอย่าง 60,000 ตัวอย่างและชุดทดสอบ 10,000 ตัวอย่างในรูปภาพระดับสีเทา 28×28 ที่เชื่อมโยงกับป้ายกำกับจาก 10 คลาสลิงค์
CVภาพIMDB-ชุดข้อมูล Wikiความบันเทิงการจดจำใบหน้าชุดข้อมูลรูปภาพใบหน้าขนาดใหญ่พร้อมป้ายกำกับ เช่น เพศและอายุ จากภาพใบหน้าทั้งหมด 523,051 ภาพ ได้ภาพ 460,723 ภาพจากดาราดัง 20,284 คนจาก IMDB และ 62,328 จาก Wikipediaลิงค์
CVวีดีโอจลนศาสตร์-700ทั่วไปสำหรับคลาสแอคชั่นแต่ละคลาส ชุดข้อมูลคุณภาพสูงประกอบด้วยคลิปวิดีโอ 650,000 คลิป และรวมคลาสแอคชั่นของมนุษย์ 700 คลาสที่มีคลิปวิดีโออย่างน้อย 600 คลิป ที่นี่แต่ละคลิปมีความยาว 10 วินาทีหรือมากกว่านั้นลิงค์
CVภาพเอ็มเอส โคโค่ทั่วไปการตรวจจับวัตถุ การแบ่งส่วนชุดข้อมูลประกอบด้วยรูปภาพ 328k และมีอินสแตนซ์ทั้งหมด 2.5 ล้านรายการและรูปภาพออบเจ็กต์ 91 รูปเพื่อฝึกการตรวจจับวัตถุขนาดใหญ่ การแบ่งส่วน และแบบจำลอง ML ที่เกี่ยวข้องกับคำอธิบายข้อมูลลิงค์
CVภาพชุดข้อมูล MPII Human Poseทั่วไปภาพถ่ายประมาณ 25K ที่มีบุคคลมากกว่า 40K ที่มีข้อต่อของร่างกายที่มีคำอธิบายประกอบรวมอยู่ในชุดข้อมูล ซึ่งใช้สำหรับการประเมินท่าทางของมนุษย์อย่างชัดเจน โดยรวมแล้ว ชุดข้อมูลครอบคลุมกิจกรรมของมนุษย์ 410 รายการ และแต่ละภาพมีป้ายกำกับกิจกรรมลิงค์
CVภาพเปิดรูปภาพทั่วไปคำอธิบายประกอบตำแหน่งออบเจ็กต์ชุดข้อมูลรูปภาพที่มีรูปภาพประมาณ 9 Mn ที่มีป้ายกำกับระดับรูปภาพ กล่องล้อมรอบออบเจ็กต์ การแบ่งส่วนออบเจ็กต์ ฯลฯ ชุดข้อมูลยังประกอบด้วย 16 Mn bounding box สำหรับคลาสอ็อบเจ็กต์ 600 คลาสบนอิมเมจ 1.9 Mnลิงค์
CVวิดีโอ, รูปภาพArgo โดย Argo สหรัฐอเมริกายานยนต์Bounding Box, Optical Flow, ป้ายพฤติกรรม, ป้ายความหมาย, Lane Markingชุดข้อมูลการขับขี่อัตโนมัติที่ประกอบด้วยแผนที่ HD ที่มีข้อมูลเมตาทางเรขาคณิตและความหมาย เช่น เส้นกึ่งกลางเลน ทิศทางของเลน และพื้นที่ที่สามารถขับได้ ชุดข้อมูลนี้ใช้เพื่อฝึกโมเดล ML เพื่อสร้างอัลกอริธึมการรับรู้ที่แม่นยำยิ่งขึ้น ซึ่งจะช่วยให้ยานพาหนะที่ขับด้วยตนเองสามารถนำทางได้อย่างปลอดภัยลิงค์
CVวีดีโอสัญญาณไฟจราจรขนาดเล็กของ Bosch โดย Bosch North America Researchยานยนต์กล่องผูกชุดข้อมูลที่ประกอบด้วยภาพจากกล้อง 13427 ภาพที่มีความละเอียด 1280*720 เพื่อสร้างระบบตรวจจับสัญญาณไฟจราจรตามวิสัยทัศน์ ชุดข้อมูลนี้มีสัญญาณไฟจราจรที่มีคำอธิบายประกอบมากกว่า 24000 รายการลิงค์
CVวีดีโอBrain4Cars โดย Cornell Univ. สหรัฐอเมริกายานยนต์ป้ายพฤติกรรมชุดข้อมูลที่ประกอบด้วยอาร์เรย์ของเซ็นเซอร์ในห้องโดยสาร (กล้อง เซ็นเซอร์สัมผัส อุปกรณ์อัจฉริยะ ฯลฯ) เพื่อดึงข้อมูลสถิติที่เป็นประโยชน์เกี่ยวกับการเตรียมพร้อมของคนขับ อัลกอริธึมของเราอาจตรวจจับคนขับที่ง่วงหรือฟุ้งซ่าน และเพิ่มสัญญาณเตือนที่จำเป็นเพื่อปรับปรุงการป้องกันลิงค์
CVภาพCULane โดยมหาวิทยาลัยจีน ของฮ่องกง ปักกิ่ง ประเทศจีนยานยนต์เครื่องหมายเลนชุดข้อมูล Computer Vision เกี่ยวกับการตรวจจับช่องจราจร ซึ่งประกอบด้วยวิดีโอ 55 ชั่วโมง โดยได้แยกเฟรม 133,235 (88880 ชุดการฝึก ชุดตรวจสอบ 9675 ชุด และชุดทดสอบ 34680 ชุด) มันถูกรวบรวมโดยกล้องที่ติดตั้งบนยานพาหนะหกคันที่แตกต่างกันซึ่งขับเคลื่อนโดยคนขับที่แตกต่างกันในปักกิ่งลิงค์
CVวีดีโอเดวิส โดย ม. ของ Zurich,ETH ¨ Zurich, Germany, Switzerlandยานยนต์ชุดข้อมูลการฝึกขับรถแบบ end-to-end ที่ใช้กล้อง DAVIS event+frame ข้อมูลรถยนต์ เช่น การบังคับเลี้ยว คันเร่ง GPS ฯลฯ ใช้เพื่อประเมินการรวมเฟรมและข้อมูลเหตุการณ์สำหรับแอปยานยนต์ลิงค์
CVวีดีโอDBNet โดยมหาวิทยาลัย Shanghai Jiao Tong มหาวิทยาลัยเซียะเหมิน ประเทศจีนยานยนต์พอยต์คลาวด์, LiDARข้อมูลการขับขี่ระยะทาง 1000 กม. ในโลกแห่งความเป็นจริง ซึ่งรวมถึงวิดีโอที่สอดคล้อง จุดคลาวด์ GPS และพฤติกรรมของผู้ขับขี่สำหรับการวิจัยเชิงลึกเกี่ยวกับพฤติกรรมการขับขี่ลิงค์
CVวีดีโอDr(eye)ve โดย ม. แห่งโมเดนาและเรจจิโอ เอมิเลีย เมืองโมเดนา ประเทศอิตาลียานยนต์ป้ายพฤติกรรมชุดข้อมูลที่มีลำดับวิดีโอ 74 รายการ แต่ละรายการละ 5 นาที ซึ่งมีคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลประกอบด้วยตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ หลักสูตร และยังติดป้ายกำกับการเพ่งสายตาของผู้ขับขี่และการผสานรวมชั่วคราวเพื่อมอบแผนที่เฉพาะงานลิงค์
CVวีดีโอคนเดินเท้า ETH (2009) โดย ETH ซูริก ซูริก สวิตเซอร์แลนด์ทั่วไปกล่องผูกชุดข้อมูลวิดีโอ 74 ลำดับ วิดีโอละ 5 นาที พร้อมคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลนี้ระบุตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ ทิศทาง และยังระบุการตรึงสายตาสำหรับผู้ขับขี่และการรวมเวลา รวมถึงแผนที่เฉพาะงานลิงค์
CVวีดีโอฟอร์ด (2009) โดย ม. มิชิแกน มิชิแกน สหรัฐอเมริกายานยนต์ขอบเขตกล่อง, , LiDARชุดข้อมูลที่รวบรวมโดยยานพาหนะทางบกแบบอัตโนมัติติดอาวุธด้วยเครื่องสแกน Velodyne 3D-lidar, Rieg lidars ที่มองไปข้างหน้าแบบกดไม้กวาดสองตัว, หน่วยวัดแรงเฉื่อยทางเทคนิคและสำหรับผู้บริโภค (IMU) และระบบกล้องรอบทิศทาง Point Grey Ladybug3ลิงค์
CVวีดีโอHCI Challenger Stereo, Bosch Corporation Research, Hildesheim, Germanyทั่วไปชุดข้อมูลหลายล้านเฟรมจากฉากวิดีโอที่ถ่ายไว้ ซึ่งรวมถึงสภาพอากาศที่หลากหลาย การเคลื่อนไหวและความลึกหลายชั้น สถานการณ์ในเมืองและชนบท ฯลฯลิงค์
CVวีดีโอJAAD โดยมหาวิทยาลัยยอร์ก ประเทศยูเครน แคนาดายานยนต์Bounding Box ป้ายพฤติกรรม"JAAD เป็นชุดข้อมูลสำหรับศึกษาความสนใจร่วมกันในบริบทของการขับขี่อัตโนมัติ โดยมุ่งเน้นที่พฤติกรรมคนเดินถนนและคนขับที่จุดข้ามและปัจจัยที่มีอิทธิพลต่อสิ่งเหล่านี้ ด้วยเหตุนี้ ชุดข้อมูล JAAD จึงนำเสนอคอลเลกชันวิดีโอสั้น 346 ที่มีคำอธิบายประกอบอย่างละเอียด คลิป (ความยาว 5-10 วินาที) ที่ดึงมาจากฟุตเทจการขับขี่กว่า 240 ชั่วโมงจากสถานที่ต่างๆ ในอเมริกาเหนือและยุโรปตะวันออก Bounding Boxes with occlusion tag ใช้สำหรับคนเดินเท้าทั้งหมดทำให้ชุดข้อมูลนี้เหมาะสำหรับการตรวจจับคนเดินถนน คำอธิบายประกอบเกี่ยวกับพฤติกรรมระบุพฤติกรรมสำหรับคนเดินถนน ที่โต้ตอบหรือต้องการความสนใจจากคนขับ สำหรับแต่ละวิดีโอ จะมีแท็กหลายแท็ก (สภาพอากาศ สถานที่ ฯลฯ) และป้ายกำกับพฤติกรรมที่ประทับเวลา (เช่น หยุด เดิน มอง ฯลฯ) นอกจากนี้ รายการคุณลักษณะทางประชากรคือ ให้คนเดินถนนแต่ละคน (เช่น อายุ เพศ ทิศทางการเคลื่อนไหว ฯลฯ) ตลอดจนรายการองค์ประกอบฉากจราจรที่มองเห็นได้ (เช่น ป้ายหยุด สัญญาณไฟจราจร ฯลฯ) ในแต่ละเฟรม"ลิงค์
CVภาพป้ายจราจร LISA โดย ม. แห่งแคลิฟอร์เนีย ซานดิเอโก สหรัฐอเมริกายานยนต์กล่องผูกชุดข้อมูลที่มีวิดีโอและเฟรมที่มีคำอธิบายประกอบซึ่งมีสัญญาณจราจรของสหรัฐอเมริกา มันถูกปล่อยออกมาในสองขั้นตอน หนึ่งมีเฉพาะรูปภาพและอีกอันที่มีทั้งรูปภาพและวิดีโอลิงค์
CVภาพMapillary Vistas โดย Mapillary AB, Globalยานยนต์ป้ายความหมายชุดข้อมูลการถ่ายภาพระดับถนนสำหรับการตีความฉากบนท้องถนนทั่วโลกด้วยคำอธิบายประกอบของมนุษย์ที่มีความแม่นยำระดับพิกเซลและเฉพาะอินสแตนซ์ลิงค์
CVวิดีโอ, รูปภาพSemantic KITTI โดย University of Bonn, Karlsruhe ประเทศเยอรมนียานยนต์Bounding Box, Semantic Label, เครื่องหมายเลนชุดข้อมูลที่มีคำอธิบายประกอบเชิงความหมายสำหรับลำดับการเปรียบเทียบการวัดระยะทางทั้งหมด ชุดข้อมูลนี้อธิบายการจราจรที่เคลื่อนที่และไม่เคลื่อนที่ประเภทต่างๆ ได้แก่ รถยนต์ จักรยาน จักรยาน คนเดินเท้า และนักปั่นจักรยาน ซึ่งช่วยให้สามารถศึกษาวัตถุในที่เกิดเหตุได้ลิงค์
CVวีดีโอStanford Track โดยมหาวิทยาลัยสแตนฟอร์ด สหรัฐอเมริกายานยนต์การตรวจจับวัตถุ / การจำแนกประเภท LiDAR, GPS, รหัสชุดข้อมูลที่มีแทร็กอ็อบเจ็กต์ติดป้ายกำกับ 14,000 รายการตามที่ Velodyne HDL-64E S2 LIDAR สังเกตในฉากท้องถนนตามธรรมชาติ ซึ่งสามารถใช้เพื่อฝึกโมเดลการเรียนรู้ของเครื่องสำหรับการรู้จำวัตถุ 3 มิติลิงค์
CVวิดีโอ, รูปภาพชุดข้อมูล Boxy โดย Bosch ประเทศสหรัฐอเมริกายานยนต์Bounding Box / การตรวจจับยานพาหนะชุดข้อมูลการตรวจจับยานพาหนะที่มียานพาหนะที่มีหมายเหตุ 2 ล้านคันสำหรับการฝึกอบรมและวิเคราะห์กลยุทธ์การจดจำวัตถุสำหรับรถยนต์ที่ขับด้วยตนเองบนทางหลวงลิงค์
CVวีดีโอTME Motorway โดย Czech Technical Univ. ทางตอนเหนือของอิตาลียานยนต์กล่องผูกชุดข้อมูล 28 คลิป รวมเวลา 27 นาที แบ่งเป็นเฟรมคำอธิบายประกอบรถยนต์กว่า 30,000 เฟรม สร้างคำอธิบายประกอบแบบกึ่งอัตโนมัติโดยใช้ข้อมูลจากเครื่องสแกนเลเซอร์ การรวบรวมข้อมูลนี้เกี่ยวข้องกับสถานการณ์การจราจรที่แปรปรวน จำนวนเลน ความโค้งของถนน และไฟส่องสว่าง ซึ่งครอบคลุมเงื่อนไขส่วนใหญ่ของการได้มาทั้งหมดลิงค์
CVวีดีโอLlamas ที่ไม่มีผู้ดูแล โดย Bosch ประเทศสหรัฐอเมริกายานยนต์เครื่องหมายเลน LiDARชุดข้อมูล Llamas ที่ไม่มีผู้ดูแลได้รับการบันทึกโดยการสร้างแผนที่การขับขี่อัตโนมัติที่มีความละเอียดสูง ซึ่งรวมถึงเครื่องหมายบอกเลนตาม Lidar รถยนต์ไร้คนขับสามารถจัดวางให้ชิดกับแผนที่เหล่านี้ และเครื่องหมายเลนจะถูกฉายเข้าไปในเฟรมของกล้อง การฉายภาพ 3 มิติได้รับการปรับให้เหมาะสมโดยลดความคลาดเคลื่อนระหว่างเครื่องหมายภาพที่สังเกตแล้วและคาดการณ์ไว้ลิงค์
NLPเสียงFacebook AI LibriSpeech หลายภาษา (MLS)ทั่วไปคำอธิบายประกอบเสียง / การรู้จำเสียงFacebook AI Multilingual LibriSpeech (MLS) เป็นชุดข้อมูลโอเพ่นซอร์สขนาดใหญ่ที่ออกแบบมาเพื่อช่วยให้การวิจัยขั้นสูงในการรู้จำคำพูดอัตโนมัติ (ASR) MLS ให้เสียงมากกว่า 50,000 ชั่วโมงใน 8 ภาษา: อังกฤษ เยอรมัน ดัตช์ ฝรั่งเศส สเปน อิตาลี โปรตุเกส และโปแลนด์ ลิงค์