เปิดชุดข้อมูล

ค้นพบชุดข้อมูลโอเพ่นซอร์สที่ให้คุณฝึกโมเดล ML

เปิดชุดข้อมูล

ชุดข้อมูลโอเพนซอร์สเพื่อให้คุณเริ่มต้นใช้งานโมเดล AI/ML

ผลลัพธ์ของโมเดล AI & ML ของคุณนั้นดีพอๆ กับข้อมูลที่คุณใช้ในการฝึกเท่านั้น ดังนั้นความแม่นยำที่คุณใช้กับการรวมข้อมูลและการติดแท็กและการระบุข้อมูลนั้นเป็นสิ่งสำคัญ!

ดังนั้น หากคุณต้องการเริ่มต้นความคิดริเริ่ม AI/ML ใหม่และตอนนี้ คุณตระหนักได้อย่างรวดเร็วว่าการค้นหาข้อมูลการฝึกอบรมคุณภาพสูงจะเป็นหนึ่งในแง่มุมที่ท้าทายมากขึ้นของโครงการของคุณ เนื่องจากชุดข้อมูลคุณภาพสูงเป็นเชื้อเพลิงที่ช่วยให้ AI/ เครื่องยนต์ ML ทำงาน เราได้รวบรวมรายการชุดข้อมูลแบบเปิดที่ใช้งานได้ฟรีและฝึกโมเดล AI/ML ของคุณในอนาคต

ความเชี่ยวชาญประเภทข้อมูลชื่อชุดข้อมูลอุตสาหกรรม / ฝ่ายคำอธิบายประกอบ/กรณีการใช้งานรายละเอียดลิงค์
NLPข้อความรีวิว AmazonE-Commerceการวิเคราะห์ความเชื่อมั่นชุดบทวิจารณ์และการให้คะแนน 35 ล้านรายการในช่วง 18 ปีที่ผ่านมาในรูปแบบข้อความธรรมดาพร้อมรายละเอียดผู้ใช้และผลิตภัณฑ์ลิงค์
NLPข้อความWikipedia ลิงก์ข้อมูลGeneralมากกว่า 4 ล้าน บทความที่มี 1.9 พันล้าน คำที่ประกอบด้วยคำและวลีตลอดจนย่อหน้าลิงค์
NLPข้อความสแตนด์ฟอร์ด เซนติเมนท์ ทรีแบงค์ความบันเทิงการวิเคราะห์ความเชื่อมั่นชุดข้อมูลคำอธิบายประกอบความคิดเห็นสำหรับบทวิจารณ์กว่า 10,000 ชิ้นจาก Rotten Tomatoes ในรูปแบบไฟล์ HTMLลิงค์
NLPข้อความTwitter ความเชื่อมั่นของสายการบินสหรัฐฯสายการบินการวิเคราะห์ความเชื่อมั่น2015 ทวีตบน US Airlines แยกออกเป็นโทนบวก ลบ และเป็นกลางลิงค์
CVภาพ ติดป้ายกำกับ Faces In The WildGeneralการจดจำใบหน้าชุดข้อมูลที่มีใบหน้าที่ครอบตัดกว่า 13,000 ใบหน้าพร้อมรูปภาพสองภาพที่แตกต่างกันสำหรับการฝึกจดจำใบหน้าลิงค์
CVวิดีโอ, รูปภาพชุดข้อมูล UMDFacesGeneralการจดจำใบหน้าชุดข้อมูลที่มีคำอธิบายประกอบที่มีใบหน้ามากกว่า 367,000 ใบหน้าจากกว่า 8,000 หัวข้อที่รวมภาพนิ่งและวิดีโอลิงค์
CVภาพ อิมเมจเน็ตGeneralชุดข้อมูลที่มีมากกว่า 14 ล้าน รูปภาพในรูปแบบไฟล์ต่างๆ จัดระเบียบตามลำดับชั้นของ WordNetลิงค์
CVภาพ รูปภาพเปิดของ GoogleGeneral9 น. URL สำหรับจัดหมวดหมู่ภาพสาธารณะจากกว่า 6,000 หมวดหมู่ลิงค์
NLPข้อความMIMIC Critical Care ฐานข้อมูลการดูแลสุขภาพชุดข้อมูลสรีรวิทยาเชิงคำนวณพร้อมข้อมูลที่ไม่ระบุตัวตนจากผู้ป่วยวิกฤต 40,000 ราย ชุดข้อมูลประกอบด้วยข้อมูล เช่น ข้อมูลประชากร สัญญาณชีพ ยารักษาโรค ฯลฯลิงค์
CVภาพสำนักงานการท่องเที่ยวและการท่องเที่ยวแห่งชาติสหรัฐอเมริกาการท่องเที่ยวให้ภาพถ่ายกว้างๆ จากอุตสาหกรรมการท่องเที่ยวพร้อมฐานข้อมูลที่น่าเชื่อถือ ครอบคลุมหัวข้อต่างๆ เช่น การเดินทางขาเข้าและขาออก และข้อมูลการท่องเที่ยวระหว่างประเทศลิงค์
NLPข้อความกรมการขนส่งการท่องเที่ยวชุดข้อมูลการท่องเที่ยวที่รวมอุทยานแห่งชาติ ทะเบียนผู้ขับขี่ สะพาน ข้อมูลรถไฟ ฯลฯลิงค์
NLPเสียงคลังคำบรรยายเสียง FlickrGeneralคำอธิบายภาพมากกว่า 40 คำบรรยายจากภาพถ่าย 8,000 ภาพที่ออกแบบมาสำหรับรูปแบบคำพูดที่ไม่มีผู้ดูแลลิงค์
NLPเสียงชุดข้อมูลคำสั่งเสียงGeneralการรู้จำเสียง คำบรรยายเสียงคำพูดยาว 1 วินาทีจากบุคคลนับพัน เพื่อสร้างอินเทอร์เฟซเสียงพื้นฐานลิงค์
NLPเสียงชุดข้อมูลเสียงสิ่งแวดล้อมGeneralสภาพแวดล้อมชุดข้อมูลเสียงที่มีเสียงของตารางเหตุการณ์และตารางฉากอะคูสติกลิงค์
NLPข้อความชุดข้อมูลการวิจัยแบบเปิดของ COVID-19 การดูแลสุขภาพAI ทางการแพทย์ชุดข้อมูลการวิจัยประกอบด้วยบทความวิชาการ 45,000 บทความเกี่ยวกับ COVID-19 และกลุ่มไวรัส coronavirusลิงค์
CVภาพWaymo เปิดชุดข้อมูล ยานยนต์ชุดข้อมูลการขับขี่อัตโนมัติที่หลากหลายที่สุดที่เผยแพร่โดย Waymoลิงค์
CVภาพจีโนมภาพ Generalคำบรรยายภาพฐานความรู้ด้านภาพพร้อมคำอธิบายภาพโดยละเอียดกว่า 100 ภาพลิงค์
CVภาพป้ายชื่อ ภาครัฐชุดรูปภาพที่มีคำอธิบายประกอบขนาดใหญ่เข้าถึงได้ผ่าน Labelme Matlabลิงค์
CVภาพขดลวด100Generalวัตถุต่างๆ กว่า 100 ชิ้นที่ถ่ายภาพจากหลายมุม (เช่น 360 องศา)ลิงค์
CVภาพชุดข้อมูล Stanford DogsGeneralรูปภาพมากกว่า 20,500+ ภาพที่จัดอยู่ในชุดรูปภาพของสุนัขต่าง ๆ 120 สายพันธุ์ลิงค์
CVภาพการจดจำฉากในร่มGeneralการจดจำฉากชุดข้อมูลเฉพาะที่ประกอบด้วย 15620 ภาพจาก 67 หมวดหมู่ในร่มเพื่อสร้างแบบจำลองการจดจำฉากลิงค์
CVภาพVisualQAGeneralชุดข้อมูลที่มีคำถามปลายเปิดที่เกี่ยวข้องกับภาพถ่าย 265,016 รูปที่ต้องใช้ความเข้าใจในการมองเห็นและความเข้าใจในภาษาเพื่อตอบลิงค์
NLPข้อความชุดข้อมูลการวิเคราะห์ความเชื่อมั่นแบบหลายโดเมนE-Commerceการวิเคราะห์ความเชื่อมั่นชุดข้อมูลที่มีการรีวิวสินค้าจาก Amazonลิงค์
NLPข้อความIMDB ความคิดเห็นความบันเทิงการวิเคราะห์ความเชื่อมั่นชุดข้อมูลที่มีบทวิจารณ์ภาพยนตร์ 25000 เรื่องสำหรับการวิเคราะห์ความเชื่อมั่นลิงค์
NLPข้อความความรู้สึก140Generalการวิเคราะห์ความเชื่อมั่นชุดข้อมูลที่มี 160,000 ทวีตพร้อมอีโมติคอนที่นำออกล่วงหน้าเพื่อความแม่นยำที่สูงขึ้นลิงค์
NLPข้อความบล็อกเกอร์คอร์ปัสGeneralการวิเคราะห์คีย์เวิร์ดชุดข้อมูลที่มี 681,288 บล็อกโพสต์จาก blogger.com ซึ่งประกอบด้วยคำภาษาอังกฤษที่ใช้กันอย่างแพร่หลายอย่างน้อย 200 ครั้งลิงค์
NLPข้อความอันตรายGeneralการฝึกอบรม Chatbotชุดข้อมูลที่มีคำถามมากกว่า 200,000 ข้อที่สามารถนำมาใช้ฝึกโมเดลการเรียนรู้ของเครื่องให้ตอบสนองอัตโนมัติได้อย่างชาญฉลาดลิงค์
NLPข้อความSMS Spam Collection เป็นภาษาอังกฤษเทเลคอมการจดจำสแปมชุดข้อมูลข้อความสแปมประกอบด้วย SMS ภาษาอังกฤษ 5,574 รายการลิงค์
NLPข้อความYelp ความคิดเห็นGeneralการวิเคราะห์ความเชื่อมั่นชุดข้อมูลที่มีบทวิจารณ์มากกว่า 5 ล้านรายการที่เผยแพร่โดย Yelpลิงค์
NLPข้อความสแปมเบสของ UCIEnterpriseการจดจำสแปมชุดข้อมูลอีเมลขยะขนาดใหญ่ มีประโยชน์สำหรับการกรองสแปมลิงค์
CVวิดีโอ, รูปภาพเบิร์กลีย์ ดีพไดรฟ์ BDD100kยานยนต์ยานพาหนะอิสระชุดข้อมูลที่ใหญ่ที่สุดชุดหนึ่งสำหรับ AI ที่ขับเคลื่อนด้วยตนเองซึ่งมีประสบการณ์การขับขี่ 1,100 ชั่วโมงในวิดีโอมากกว่า 100,000 รายการจากช่วงเวลาต่างๆ ของวันจากพื้นที่นิวยอร์กและซานฟรานซิสโกลิงค์
CVวีดีโอจุลภาค.aiยานยนต์ยานพาหนะอิสระ ชุดข้อมูลการขับขี่บนทางหลวง 7 ชั่วโมง ประกอบด้วยข้อมูลความเร็ว ความเร่ง มุมบังคับเลี้ยว และพิกัด GPS ของรถลิงค์
CVวิดีโอ, รูปภาพชุดข้อมูลทิวทัศน์เมืองยานยนต์ฉลากความหมายสำหรับรถยนต์ขับเคลื่อนอัตโนมัติชุดข้อมูลคำอธิบายประกอบระดับ 5,000 พิกเซลพร้อมชุดเฟรมที่ใส่คำอธิบายประกอบไม่แน่นหนา 20,000 เฟรมในลำดับวิดีโอสเตอริโอที่บันทึกจาก 50 เมืองที่แตกต่างกันลิงค์
CVภาพชุดข้อมูลป้ายจราจร KUL เบลเยียมยานยนต์ยานพาหนะอิสระคำอธิบายประกอบเครื่องหมายจราจรมากกว่า 10000 รายการจากภูมิภาคแฟลนเดอร์ส โดยอิงจากสัญญาณจราจรที่แตกต่างกันตามร่างกายจากทั่วเบลเยียมลิงค์
CVภาพLISA: ห้องปฏิบัติการสำหรับรถยนต์อัจฉริยะและปลอดภัย UC San Diego Datasetsยานยนต์ยานพาหนะอิสระชุดข้อมูลที่สมบูรณ์ซึ่งประกอบด้วยป้ายจราจร การตรวจจับยานพาหนะ สัญญาณไฟจราจร และรูปแบบวิถีลิงค์
CVภาพซิฟาร์ -10GeneralการจดจำวัตถุObjectชุดข้อมูลประกอบด้วยภาพ 50,000 ภาพและภาพทดสอบ 10,000 ภาพ (เช่น ภาพสี 60,000 32×32 ใน 10 คลาส) สำหรับการจดจำวัตถุลิงค์
CVภาพแฟชั่น MNISTร้านแฟชั่นเกาหลีชุดข้อมูลรูปภาพที่ประกอบด้วยตัวอย่าง 60,000 ตัวอย่างและชุดทดสอบ 10,000 ตัวอย่างในรูปภาพระดับสีเทา 28×28 ที่เชื่อมโยงกับป้ายกำกับจาก 10 คลาสลิงค์
CVภาพIMDB-ชุดข้อมูล Wikiความบันเทิงการจดจำใบหน้าชุดข้อมูลรูปภาพใบหน้าขนาดใหญ่พร้อมป้ายกำกับ เช่น เพศและอายุ จากภาพใบหน้าทั้งหมด 523,051 ภาพ ได้ภาพ 460,723 ภาพจากดาราดัง 20,284 คนจาก IMDB และ 62,328 จาก Wikipediaลิงค์
CVวีดีโอจลนศาสตร์-700Generalสำหรับคลาสแอคชั่นแต่ละคลาส ชุดข้อมูลคุณภาพสูงประกอบด้วยคลิปวิดีโอ 650,000 คลิป และรวมคลาสแอคชั่นของมนุษย์ 700 คลาสที่มีคลิปวิดีโออย่างน้อย 600 คลิป ที่นี่แต่ละคลิปมีความยาว 10 วินาทีหรือมากกว่านั้นลิงค์
CVภาพเอ็มเอส โคโค่Generalการตรวจจับวัตถุ การแบ่งส่วนชุดข้อมูลประกอบด้วยรูปภาพ 328k และมีอินสแตนซ์ทั้งหมด 2.5 ล้านรายการและรูปภาพออบเจ็กต์ 91 รูปเพื่อฝึกการตรวจจับวัตถุขนาดใหญ่ การแบ่งส่วน และแบบจำลอง ML ที่เกี่ยวข้องกับคำอธิบายข้อมูลลิงค์
CVภาพชุดข้อมูล MPII Human PoseGeneralภาพถ่ายประมาณ 25K ที่มีบุคคลมากกว่า 40K ที่มีข้อต่อของร่างกายที่มีคำอธิบายประกอบรวมอยู่ในชุดข้อมูล ซึ่งใช้สำหรับการประเมินท่าทางของมนุษย์อย่างชัดเจน โดยรวมแล้ว ชุดข้อมูลครอบคลุมกิจกรรมของมนุษย์ 410 รายการ และแต่ละภาพมีป้ายกำกับกิจกรรมลิงค์
CVภาพเปิดรูปภาพGeneralคำอธิบายประกอบตำแหน่งออบเจ็กต์ชุดข้อมูลรูปภาพที่มีรูปภาพประมาณ 9 Mn ที่มีป้ายกำกับระดับรูปภาพ กล่องล้อมรอบออบเจ็กต์ การแบ่งส่วนออบเจ็กต์ ฯลฯ ชุดข้อมูลยังประกอบด้วย 16 Mn bounding box สำหรับคลาสอ็อบเจ็กต์ 600 คลาสบนอิมเมจ 1.9 Mnลิงค์
CVวีดีโอApollo Open Platform โดย Baidu Inc ประเทศจีนยานยนต์บาวน์ดิ้ง บ็อกซ์, LiDARชุดข้อมูลการขับขี่อัตโนมัติที่สมบูรณ์ ซึ่งให้ข้อมูลที่จำเป็นแก่นักพัฒนาในการขับขี่อัตโนมัติเพื่อเร่งประสิทธิภาพของการทำซ้ำที่เป็นนวัตกรรมใหม่ลิงค์
CVวิดีโอ, รูปภาพArgo โดย Argo สหรัฐอเมริกายานยนต์Bounding Box, Optical Flow, ป้ายพฤติกรรม, ป้ายความหมาย, Lane Markingชุดข้อมูลการขับขี่อัตโนมัติที่ประกอบด้วยแผนที่ HD ที่มีข้อมูลเมตาทางเรขาคณิตและความหมาย เช่น เส้นกึ่งกลางเลน ทิศทางของเลน และพื้นที่ที่สามารถขับได้ ชุดข้อมูลนี้ใช้เพื่อฝึกโมเดล ML เพื่อสร้างอัลกอริธึมการรับรู้ที่แม่นยำยิ่งขึ้น ซึ่งจะช่วยให้ยานพาหนะที่ขับด้วยตนเองสามารถนำทางได้อย่างปลอดภัยลิงค์
CVวีดีโอสัญญาณไฟจราจรขนาดเล็กของ Bosch โดย Bosch North America Researchยานยนต์กล่องผูกชุดข้อมูลที่ประกอบด้วยภาพจากกล้อง 13427 ภาพที่มีความละเอียด 1280*720 เพื่อสร้างระบบตรวจจับสัญญาณไฟจราจรตามวิสัยทัศน์ ชุดข้อมูลนี้มีสัญญาณไฟจราจรที่มีคำอธิบายประกอบมากกว่า 24000 รายการลิงค์
CVวีดีโอBrain4Cars โดย Cornell Univ. สหรัฐอเมริกายานยนต์ป้ายพฤติกรรมชุดข้อมูลที่ประกอบด้วยอาร์เรย์ของเซ็นเซอร์ในห้องโดยสาร (กล้อง เซ็นเซอร์สัมผัส อุปกรณ์อัจฉริยะ ฯลฯ) เพื่อดึงข้อมูลสถิติที่เป็นประโยชน์เกี่ยวกับการเตรียมพร้อมของคนขับ อัลกอริธึมของเราอาจตรวจจับคนขับที่ง่วงหรือฟุ้งซ่าน และเพิ่มสัญญาณเตือนที่จำเป็นเพื่อปรับปรุงการป้องกันลิงค์
CVภาพCULane โดยมหาวิทยาลัยจีน ของฮ่องกง ปักกิ่ง ประเทศจีนยานยนต์เครื่องหมายเลนชุดข้อมูล Computer Vision เกี่ยวกับการตรวจจับช่องจราจร ซึ่งประกอบด้วยวิดีโอ 55 ชั่วโมง โดยได้แยกเฟรม 133,235 (88880 ชุดการฝึก ชุดตรวจสอบ 9675 ชุด และชุดทดสอบ 34680 ชุด) มันถูกรวบรวมโดยกล้องที่ติดตั้งบนยานพาหนะหกคันที่แตกต่างกันซึ่งขับเคลื่อนโดยคนขับที่แตกต่างกันในปักกิ่งลิงค์
CVวีดีโอเดวิส โดย ม. ของ Zurich,ETH ¨ Zurich, Germany, Switzerlandยานยนต์ชุดข้อมูลการฝึกขับรถแบบ end-to-end ที่ใช้กล้อง DAVIS event+frame ข้อมูลรถยนต์ เช่น การบังคับเลี้ยว คันเร่ง GPS ฯลฯ ใช้เพื่อประเมินการรวมเฟรมและข้อมูลเหตุการณ์สำหรับแอปยานยนต์ลิงค์
CVวีดีโอDBNet โดยมหาวิทยาลัย Shanghai Jiao Tong มหาวิทยาลัยเซียะเหมิน ประเทศจีนยานยนต์พอยต์คลาวด์, LiDARข้อมูลการขับขี่ระยะทาง 1000 กม. ในโลกแห่งความเป็นจริง ซึ่งรวมถึงวิดีโอที่สอดคล้อง จุดคลาวด์ GPS และพฤติกรรมของผู้ขับขี่สำหรับการวิจัยเชิงลึกเกี่ยวกับพฤติกรรมการขับขี่ลิงค์
CVวีดีโอDr(eye)ve โดย ม. แห่งโมเดนาและเรจจิโอ เอมิเลีย เมืองโมเดนา ประเทศอิตาลียานยนต์ป้ายพฤติกรรมชุดข้อมูลที่มีลำดับวิดีโอ 74 รายการ แต่ละรายการละ 5 นาที ซึ่งมีคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลประกอบด้วยตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ หลักสูตร และยังติดป้ายกำกับการเพ่งสายตาของผู้ขับขี่และการผสานรวมชั่วคราวเพื่อมอบแผนที่เฉพาะงานลิงค์
CVวีดีโอคนเดินเท้า ETH (2009) โดย ETH ซูริก ซูริก สวิตเซอร์แลนด์Generalกล่องผูกชุดข้อมูลวิดีโอ 74 ลำดับ วิดีโอละ 5 นาที พร้อมคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลนี้ระบุตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ ทิศทาง และยังระบุการตรึงสายตาสำหรับผู้ขับขี่และการรวมเวลา รวมถึงแผนที่เฉพาะงานลิงค์
CVวีดีโอฟอร์ด (2009) โดย ม. มิชิแกน มิชิแกน สหรัฐอเมริกายานยนต์ขอบเขตกล่อง, , LiDARชุดข้อมูลที่รวบรวมโดยยานพาหนะทางบกแบบอัตโนมัติติดอาวุธด้วยเครื่องสแกน Velodyne 3D-lidar, Rieg lidars ที่มองไปข้างหน้าแบบกดไม้กวาดสองตัว, หน่วยวัดแรงเฉื่อยทางเทคนิคและสำหรับผู้บริโภค (IMU) และระบบกล้องรอบทิศทาง Point Grey Ladybug3ลิงค์
CVวีดีโอHCI Challenger Stereo, Bosch Corporation Research, Hildesheim, GermanyGeneralชุดข้อมูลหลายล้านเฟรมจากฉากวิดีโอที่ถ่ายไว้ ซึ่งรวมถึงสภาพอากาศที่หลากหลาย การเคลื่อนไหวและความลึกหลายชั้น สถานการณ์ในเมืองและชนบท ฯลฯลิงค์
CVวีดีโอJAAD โดยมหาวิทยาลัยยอร์ก ประเทศยูเครน แคนาดายานยนต์Bounding Box ป้ายพฤติกรรม"JAAD เป็นชุดข้อมูลสำหรับศึกษาความสนใจร่วมกันในบริบทของการขับขี่อัตโนมัติ โดยมุ่งเน้นที่พฤติกรรมคนเดินถนนและคนขับที่จุดข้ามและปัจจัยที่มีอิทธิพลต่อสิ่งเหล่านี้ ด้วยเหตุนี้ ชุดข้อมูล JAAD จึงนำเสนอคอลเลกชันวิดีโอสั้น 346 ที่มีคำอธิบายประกอบอย่างละเอียด คลิป (ความยาว 5-10 วินาที) ที่ดึงมาจากฟุตเทจการขับขี่กว่า 240 ชั่วโมงจากสถานที่ต่างๆ ในอเมริกาเหนือและยุโรปตะวันออก Bounding Boxes with occlusion tag ใช้สำหรับคนเดินเท้าทั้งหมดทำให้ชุดข้อมูลนี้เหมาะสำหรับการตรวจจับคนเดินถนน คำอธิบายประกอบเกี่ยวกับพฤติกรรมระบุพฤติกรรมสำหรับคนเดินถนน ที่โต้ตอบหรือต้องการความสนใจจากคนขับ สำหรับแต่ละวิดีโอ จะมีแท็กหลายแท็ก (สภาพอากาศ สถานที่ ฯลฯ) และป้ายกำกับพฤติกรรมที่ประทับเวลา (เช่น หยุด เดิน มอง ฯลฯ) นอกจากนี้ รายการคุณลักษณะทางประชากรคือ ให้คนเดินถนนแต่ละคน (เช่น อายุ เพศ ทิศทางการเคลื่อนไหว ฯลฯ) ตลอดจนรายการองค์ประกอบฉากจราจรที่มองเห็นได้ (เช่น ป้ายหยุด สัญญาณไฟจราจร ฯลฯ) ในแต่ละเฟรม"ลิงค์
CVวีดีโอKAIST Urban โดย KAIST ประเทศเกาหลีใต้GeneralLiDARการรวบรวมข้อมูลประกอบด้วยเซ็นเซอร์ตำแหน่งจำนวนมากสำหรับข้อมูล LiDAR และภาพสเตอริโอที่กำหนดเป้าหมายไปยังเขตเมืองที่ซับซ้อนมาก (เช่น พื้นที่มหานคร อาคารที่ซับซ้อน และพื้นที่อยู่อาศัย)ลิงค์
CVภาพป้ายจราจร LISA โดย ม. แห่งแคลิฟอร์เนีย ซานดิเอโก สหรัฐอเมริกายานยนต์กล่องผูกชุดข้อมูลที่มีวิดีโอและเฟรมที่มีคำอธิบายประกอบซึ่งมีสัญญาณจราจรของสหรัฐอเมริกา มันถูกปล่อยออกมาในสองขั้นตอน หนึ่งมีเฉพาะรูปภาพและอีกอันที่มีทั้งรูปภาพและวิดีโอลิงค์
CVภาพMapillary Vistas โดย Mapillary AB, Globalยานยนต์ป้ายความหมายชุดข้อมูลการถ่ายภาพระดับถนนสำหรับการตีความฉากบนท้องถนนทั่วโลกด้วยคำอธิบายประกอบของมนุษย์ที่มีความแม่นยำระดับพิกเซลและเฉพาะอินสแตนซ์ลิงค์
CVวิดีโอ, รูปภาพSemantic KITTI โดย University of Bonn, Karlsruhe ประเทศเยอรมนียานยนต์Bounding Box, Semantic Label, เครื่องหมายเลนชุดข้อมูลที่มีคำอธิบายประกอบเชิงความหมายสำหรับลำดับการเปรียบเทียบการวัดระยะทางทั้งหมด ชุดข้อมูลนี้อธิบายการจราจรที่เคลื่อนที่และไม่เคลื่อนที่ประเภทต่างๆ ได้แก่ รถยนต์ จักรยาน จักรยาน คนเดินเท้า และนักปั่นจักรยาน ซึ่งช่วยให้สามารถศึกษาวัตถุในที่เกิดเหตุได้ลิงค์
CVวีดีโอStanford Track โดยมหาวิทยาลัยสแตนฟอร์ด สหรัฐอเมริกายานยนต์การตรวจจับวัตถุ / การจำแนกประเภท LiDAR, GPS, รหัสชุดข้อมูลที่มีแทร็กอ็อบเจ็กต์ติดป้ายกำกับ 14,000 รายการตามที่ Velodyne HDL-64E S2 LIDAR สังเกตในฉากท้องถนนตามธรรมชาติ ซึ่งสามารถใช้เพื่อฝึกโมเดลการเรียนรู้ของเครื่องสำหรับการรู้จำวัตถุ 3 มิติลิงค์
CVวิดีโอ, รูปภาพชุดข้อมูล Boxy โดย Bosch ประเทศสหรัฐอเมริกายานยนต์Bounding Box / การตรวจจับยานพาหนะชุดข้อมูลการตรวจจับยานพาหนะที่มียานพาหนะที่มีหมายเหตุ 2 ล้านคันสำหรับการฝึกอบรมและวิเคราะห์กลยุทธ์การจดจำวัตถุสำหรับรถยนต์ที่ขับด้วยตนเองบนทางหลวงลิงค์
CVวีดีโอTME Motorway โดย Czech Technical Univ. ทางตอนเหนือของอิตาลียานยนต์กล่องผูกชุดข้อมูล 28 คลิป รวมเวลา 27 นาที แบ่งเป็นเฟรมคำอธิบายประกอบรถยนต์กว่า 30,000 เฟรม สร้างคำอธิบายประกอบแบบกึ่งอัตโนมัติโดยใช้ข้อมูลจากเครื่องสแกนเลเซอร์ การรวบรวมข้อมูลนี้เกี่ยวข้องกับสถานการณ์การจราจรที่แปรปรวน จำนวนเลน ความโค้งของถนน และไฟส่องสว่าง ซึ่งครอบคลุมเงื่อนไขส่วนใหญ่ของการได้มาทั้งหมดลิงค์
CVวีดีโอLlamas ที่ไม่มีผู้ดูแล โดย Bosch ประเทศสหรัฐอเมริกายานยนต์เครื่องหมายเลน LiDARชุดข้อมูล Llamas ที่ไม่มีผู้ดูแลได้รับการบันทึกโดยการสร้างแผนที่การขับขี่อัตโนมัติที่มีความละเอียดสูง ซึ่งรวมถึงเครื่องหมายบอกเลนตาม Lidar รถยนต์ไร้คนขับสามารถจัดวางให้ชิดกับแผนที่เหล่านี้ และเครื่องหมายเลนจะถูกฉายเข้าไปในเฟรมของกล้อง การฉายภาพ 3 มิติได้รับการปรับให้เหมาะสมโดยลดความคลาดเคลื่อนระหว่างเครื่องหมายภาพที่สังเกตแล้วและคาดการณ์ไว้ลิงค์
NLPเสียงFacebook AI LibriSpeech หลายภาษา (MLS)Generalคำอธิบายประกอบเสียง / การรู้จำเสียงFacebook AI Multilingual LibriSpeech (MLS) เป็นชุดข้อมูลโอเพ่นซอร์สขนาดใหญ่ที่ออกแบบมาเพื่อช่วยให้การวิจัยขั้นสูงในการรู้จำคำพูดอัตโนมัติ (ASR) MLS ให้เสียงมากกว่า 50,000 ชั่วโมงใน 8 ภาษา: อังกฤษ เยอรมัน ดัตช์ ฝรั่งเศส สเปน อิตาลี โปรตุเกส และโปแลนด์ ลิงค์