เปิดชุดข้อมูล
ค้นพบชุดข้อมูลโอเพ่นซอร์สที่ให้คุณฝึกโมเดล ML
ชุดข้อมูลโอเพนซอร์สเพื่อให้คุณเริ่มต้นใช้งานโมเดล AI/ML
ผลลัพธ์ของโมเดล AI & ML ของคุณนั้นดีพอๆ กับข้อมูลที่คุณใช้ในการฝึกเท่านั้น ดังนั้นความแม่นยำที่คุณใช้กับการรวมข้อมูลและการติดแท็กและการระบุข้อมูลนั้นเป็นสิ่งสำคัญ!
ดังนั้น หากคุณต้องการเริ่มต้นความคิดริเริ่ม AI/ML ใหม่และตอนนี้ คุณตระหนักได้อย่างรวดเร็วว่าการค้นหาข้อมูลการฝึกอบรมคุณภาพสูงจะเป็นหนึ่งในแง่มุมที่ท้าทายมากขึ้นของโครงการของคุณ เนื่องจากชุดข้อมูลคุณภาพสูงเป็นเชื้อเพลิงที่ช่วยให้ AI/ เครื่องยนต์ ML ทำงาน เราได้รวบรวมรายการชุดข้อมูลแบบเปิดที่ใช้งานได้ฟรีและฝึกโมเดล AI/ML ของคุณในอนาคต
ความเชี่ยวชาญ | ประเภทข้อมูล | ชื่อชุดข้อมูล | อุตสาหกรรม / ฝ่าย | คำอธิบายประกอบ/กรณีการใช้งาน | รายละเอียด | ลิงค์ |
---|---|---|---|---|---|---|
NLP | ข้อความ | รีวิว Amazon | E-Commerce | การวิเคราะห์ความเชื่อมั่น | ชุดบทวิจารณ์และการให้คะแนน 35 ล้านรายการในช่วง 18 ปีที่ผ่านมาในรูปแบบข้อความธรรมดาพร้อมรายละเอียดผู้ใช้และผลิตภัณฑ์ | ลิงค์ |
NLP | ข้อความ | Wikipedia ลิงก์ข้อมูล | General | มากกว่า 4 ล้าน บทความที่มี 1.9 พันล้าน คำที่ประกอบด้วยคำและวลีตลอดจนย่อหน้า | ลิงค์ | |
NLP | ข้อความ | สแตนด์ฟอร์ด เซนติเมนท์ ทรีแบงค์ | ความบันเทิง | การวิเคราะห์ความเชื่อมั่น | ชุดข้อมูลคำอธิบายประกอบความคิดเห็นสำหรับบทวิจารณ์กว่า 10,000 ชิ้นจาก Rotten Tomatoes ในรูปแบบไฟล์ HTML | ลิงค์ |
NLP | ข้อความ | Twitter ความเชื่อมั่นของสายการบินสหรัฐฯ | สายการบิน | การวิเคราะห์ความเชื่อมั่น | 2015 ทวีตบน US Airlines แยกออกเป็นโทนบวก ลบ และเป็นกลาง | ลิงค์ |
CV | ภาพ | ติดป้ายกำกับ Faces In The Wild | General | การจดจำใบหน้า | ชุดข้อมูลที่มีใบหน้าที่ครอบตัดกว่า 13,000 ใบหน้าพร้อมรูปภาพสองภาพที่แตกต่างกันสำหรับการฝึกจดจำใบหน้า | ลิงค์ |
CV | วิดีโอ, รูปภาพ | ชุดข้อมูล UMDFaces | General | การจดจำใบหน้า | ชุดข้อมูลที่มีคำอธิบายประกอบที่มีใบหน้ามากกว่า 367,000 ใบหน้าจากกว่า 8,000 หัวข้อที่รวมภาพนิ่งและวิดีโอ | ลิงค์ |
CV | ภาพ | อิมเมจเน็ต | General | ชุดข้อมูลที่มีมากกว่า 14 ล้าน รูปภาพในรูปแบบไฟล์ต่างๆ จัดระเบียบตามลำดับชั้นของ WordNet | ลิงค์ | |
CV | ภาพ | รูปภาพเปิดของ Google | General | 9 น. URL สำหรับจัดหมวดหมู่ภาพสาธารณะจากกว่า 6,000 หมวดหมู่ | ลิงค์ | |
NLP | ข้อความ | MIMIC Critical Care ฐานข้อมูล | การดูแลสุขภาพ | ชุดข้อมูลสรีรวิทยาเชิงคำนวณพร้อมข้อมูลที่ไม่ระบุตัวตนจากผู้ป่วยวิกฤต 40,000 ราย ชุดข้อมูลประกอบด้วยข้อมูล เช่น ข้อมูลประชากร สัญญาณชีพ ยารักษาโรค ฯลฯ | ลิงค์ | |
CV | ภาพ | สำนักงานการท่องเที่ยวและการท่องเที่ยวแห่งชาติสหรัฐอเมริกา | การท่องเที่ยว | ให้ภาพถ่ายกว้างๆ จากอุตสาหกรรมการท่องเที่ยวพร้อมฐานข้อมูลที่น่าเชื่อถือ ครอบคลุมหัวข้อต่างๆ เช่น การเดินทางขาเข้าและขาออก และข้อมูลการท่องเที่ยวระหว่างประเทศ | ลิงค์ | |
NLP | ข้อความ | กรมการขนส่ง | การท่องเที่ยว | ชุดข้อมูลการท่องเที่ยวที่รวมอุทยานแห่งชาติ ทะเบียนผู้ขับขี่ สะพาน ข้อมูลรถไฟ ฯลฯ | ลิงค์ | |
NLP | เสียง | คลังคำบรรยายเสียง Flickr | General | คำอธิบายภาพมากกว่า 40 คำบรรยายจากภาพถ่าย 8,000 ภาพที่ออกแบบมาสำหรับรูปแบบคำพูดที่ไม่มีผู้ดูแล | ลิงค์ | |
NLP | เสียง | ชุดข้อมูลคำสั่งเสียง | General | การรู้จำเสียง คำบรรยายเสียง | คำพูดยาว 1 วินาทีจากบุคคลนับพัน เพื่อสร้างอินเทอร์เฟซเสียงพื้นฐาน | ลิงค์ |
NLP | เสียง | ชุดข้อมูลเสียงสิ่งแวดล้อม | General | สภาพแวดล้อมชุดข้อมูลเสียงที่มีเสียงของตารางเหตุการณ์และตารางฉากอะคูสติก | ลิงค์ | |
NLP | ข้อความ | ชุดข้อมูลการวิจัยแบบเปิดของ COVID-19 | การดูแลสุขภาพ | AI ทางการแพทย์ | ชุดข้อมูลการวิจัยประกอบด้วยบทความวิชาการ 45,000 บทความเกี่ยวกับ COVID-19 และกลุ่มไวรัส coronavirus | ลิงค์ |
CV | ภาพ | Waymo เปิดชุดข้อมูล | ยานยนต์ | ชุดข้อมูลการขับขี่อัตโนมัติที่หลากหลายที่สุดที่เผยแพร่โดย Waymo | ลิงค์ | |
CV | ภาพ | จีโนมภาพ | General | คำบรรยายภาพ | ฐานความรู้ด้านภาพพร้อมคำอธิบายภาพโดยละเอียดกว่า 100 ภาพ | ลิงค์ |
CV | ภาพ | ป้ายชื่อ | ภาครัฐ | ชุดรูปภาพที่มีคำอธิบายประกอบขนาดใหญ่เข้าถึงได้ผ่าน Labelme Matlab | ลิงค์ | |
CV | ภาพ | ขดลวด100 | General | วัตถุต่างๆ กว่า 100 ชิ้นที่ถ่ายภาพจากหลายมุม (เช่น 360 องศา) | ลิงค์ | |
CV | ภาพ | ชุดข้อมูล Stanford Dogs | General | รูปภาพมากกว่า 20,500+ ภาพที่จัดอยู่ในชุดรูปภาพของสุนัขต่าง ๆ 120 สายพันธุ์ | ลิงค์ | |
CV | ภาพ | การจดจำฉากในร่ม | General | การจดจำฉาก | ชุดข้อมูลเฉพาะที่ประกอบด้วย 15620 ภาพจาก 67 หมวดหมู่ในร่มเพื่อสร้างแบบจำลองการจดจำฉาก | ลิงค์ |
CV | ภาพ | VisualQA | General | ชุดข้อมูลที่มีคำถามปลายเปิดที่เกี่ยวข้องกับภาพถ่าย 265,016 รูปที่ต้องใช้ความเข้าใจในการมองเห็นและความเข้าใจในภาษาเพื่อตอบ | ลิงค์ | |
NLP | ข้อความ | ชุดข้อมูลการวิเคราะห์ความเชื่อมั่นแบบหลายโดเมน | E-Commerce | การวิเคราะห์ความเชื่อมั่น | ชุดข้อมูลที่มีการรีวิวสินค้าจาก Amazon | ลิงค์ |
NLP | ข้อความ | IMDB ความคิดเห็น | ความบันเทิง | การวิเคราะห์ความเชื่อมั่น | ชุดข้อมูลที่มีบทวิจารณ์ภาพยนตร์ 25000 เรื่องสำหรับการวิเคราะห์ความเชื่อมั่น | ลิงค์ |
NLP | ข้อความ | ความรู้สึก140 | General | การวิเคราะห์ความเชื่อมั่น | ชุดข้อมูลที่มี 160,000 ทวีตพร้อมอีโมติคอนที่นำออกล่วงหน้าเพื่อความแม่นยำที่สูงขึ้น | ลิงค์ |
NLP | ข้อความ | บล็อกเกอร์คอร์ปัส | General | การวิเคราะห์คีย์เวิร์ด | ชุดข้อมูลที่มี 681,288 บล็อกโพสต์จาก blogger.com ซึ่งประกอบด้วยคำภาษาอังกฤษที่ใช้กันอย่างแพร่หลายอย่างน้อย 200 ครั้ง | ลิงค์ |
NLP | ข้อความ | อันตราย | General | การฝึกอบรม Chatbot | ชุดข้อมูลที่มีคำถามมากกว่า 200,000 ข้อที่สามารถนำมาใช้ฝึกโมเดลการเรียนรู้ของเครื่องให้ตอบสนองอัตโนมัติได้อย่างชาญฉลาด | ลิงค์ |
NLP | ข้อความ | SMS Spam Collection เป็นภาษาอังกฤษ | เทเลคอม | การจดจำสแปม | ชุดข้อมูลข้อความสแปมประกอบด้วย SMS ภาษาอังกฤษ 5,574 รายการ | ลิงค์ |
NLP | ข้อความ | Yelp ความคิดเห็น | General | การวิเคราะห์ความเชื่อมั่น | ชุดข้อมูลที่มีบทวิจารณ์มากกว่า 5 ล้านรายการที่เผยแพร่โดย Yelp | ลิงค์ |
NLP | ข้อความ | สแปมเบสของ UCI | Enterprise | การจดจำสแปม | ชุดข้อมูลอีเมลขยะขนาดใหญ่ มีประโยชน์สำหรับการกรองสแปม | ลิงค์ |
CV | วิดีโอ, รูปภาพ | Berkeley DeepDrive BDD100k | ยานยนต์ | ยานพาหนะอิสระ | ชุดข้อมูลที่ใหญ่ที่สุดชุดหนึ่งสำหรับ AI ที่ขับเคลื่อนด้วยตนเองซึ่งมีประสบการณ์การขับขี่ 1,100 ชั่วโมงในวิดีโอมากกว่า 100,000 รายการจากช่วงเวลาต่างๆ ของวันจากพื้นที่นิวยอร์กและซานฟรานซิสโก | ลิงค์ |
CV | วีดีโอ | จุลภาค.ai | ยานยนต์ | ยานพาหนะอิสระ | ชุดข้อมูลการขับขี่บนทางหลวง 7 ชั่วโมง ประกอบด้วยข้อมูลความเร็ว ความเร่ง มุมบังคับเลี้ยว และพิกัด GPS ของรถ | ลิงค์ |
CV | วิดีโอ, รูปภาพ | ชุดข้อมูลทิวทัศน์เมือง | ยานยนต์ | ฉลากความหมายสำหรับรถยนต์ขับเคลื่อนอัตโนมัติ | ชุดข้อมูลคำอธิบายประกอบระดับ 5,000 พิกเซลพร้อมชุดเฟรมที่ใส่คำอธิบายประกอบไม่แน่นหนา 20,000 เฟรมในลำดับวิดีโอสเตอริโอที่บันทึกจาก 50 เมืองที่แตกต่างกัน | ลิงค์ |
CV | ภาพ | ชุดข้อมูลป้ายจราจร KUL เบลเยียม | ยานยนต์ | ยานพาหนะอิสระ | คำอธิบายประกอบเครื่องหมายจราจรมากกว่า 10000 รายการจากภูมิภาคแฟลนเดอร์ส โดยอิงจากสัญญาณจราจรที่แตกต่างกันตามร่างกายจากทั่วเบลเยียม | ลิงค์ |
CV | ภาพ | LISA: ห้องปฏิบัติการสำหรับรถยนต์อัจฉริยะและปลอดภัย UC San Diego Datasets | ยานยนต์ | ยานพาหนะอิสระ | ชุดข้อมูลที่สมบูรณ์ซึ่งประกอบด้วยป้ายจราจร การตรวจจับยานพาหนะ สัญญาณไฟจราจร และรูปแบบวิถี | ลิงค์ |
CV | ภาพ | ซิฟาร์ -10 | General | การจดจำวัตถุObject | ชุดข้อมูลประกอบด้วยภาพ 50,000 ภาพและภาพทดสอบ 10,000 ภาพ (เช่น ภาพสี 60,000 32×32 ใน 10 คลาส) สำหรับการจดจำวัตถุ | ลิงค์ |
CV | ภาพ | แฟชั่น MNIST | ร้านแฟชั่นเกาหลี | ชุดข้อมูลรูปภาพที่ประกอบด้วยตัวอย่าง 60,000 ตัวอย่างและชุดทดสอบ 10,000 ตัวอย่างในรูปภาพระดับสีเทา 28×28 ที่เชื่อมโยงกับป้ายกำกับจาก 10 คลาส | ลิงค์ | |
CV | ภาพ | IMDB-ชุดข้อมูล Wiki | ความบันเทิง | การจดจำใบหน้า | ชุดข้อมูลรูปภาพใบหน้าขนาดใหญ่พร้อมป้ายกำกับ เช่น เพศและอายุ จากภาพใบหน้าทั้งหมด 523,051 ภาพ ได้ภาพ 460,723 ภาพจากดาราดัง 20,284 คนจาก IMDB และ 62,328 จาก Wikipedia | ลิงค์ |
CV | วีดีโอ | จลนศาสตร์-700 | General | สำหรับคลาสแอคชั่นแต่ละคลาส ชุดข้อมูลคุณภาพสูงประกอบด้วยคลิปวิดีโอ 650,000 คลิป และรวมคลาสแอคชั่นของมนุษย์ 700 คลาสที่มีคลิปวิดีโออย่างน้อย 600 คลิป ที่นี่แต่ละคลิปมีความยาว 10 วินาทีหรือมากกว่านั้น | ลิงค์ | |
CV | ภาพ | เอ็มเอส โคโค่ | General | การตรวจจับวัตถุ การแบ่งส่วน | ชุดข้อมูลประกอบด้วยรูปภาพ 328k และมีอินสแตนซ์ทั้งหมด 2.5 ล้านรายการและรูปภาพออบเจ็กต์ 91 รูปเพื่อฝึกการตรวจจับวัตถุขนาดใหญ่ การแบ่งส่วน และแบบจำลอง ML ที่เกี่ยวข้องกับคำอธิบายข้อมูล | ลิงค์ |
CV | ภาพ | ชุดข้อมูล MPII Human Pose | General | ภาพถ่ายประมาณ 25K ที่มีบุคคลมากกว่า 40K ที่มีข้อต่อของร่างกายที่มีคำอธิบายประกอบรวมอยู่ในชุดข้อมูล ซึ่งใช้สำหรับการประเมินท่าทางของมนุษย์อย่างชัดเจน โดยรวมแล้ว ชุดข้อมูลครอบคลุมกิจกรรมของมนุษย์ 410 รายการ และแต่ละภาพมีป้ายกำกับกิจกรรม | ลิงค์ | |
CV | ภาพ | เปิดรูปภาพ | General | คำอธิบายประกอบตำแหน่งออบเจ็กต์ | ชุดข้อมูลรูปภาพที่มีรูปภาพประมาณ 9 Mn ที่มีป้ายกำกับระดับรูปภาพ กล่องล้อมรอบออบเจ็กต์ การแบ่งส่วนออบเจ็กต์ ฯลฯ ชุดข้อมูลยังประกอบด้วย 16 Mn bounding box สำหรับคลาสอ็อบเจ็กต์ 600 คลาสบนอิมเมจ 1.9 Mn | ลิงค์ |
CV | วีดีโอ | Apollo Open Platform โดย Baidu Inc ประเทศจีน | ยานยนต์ | บาวน์ดิ้ง บ็อกซ์, LiDAR | ชุดข้อมูลการขับขี่อัตโนมัติที่สมบูรณ์ ซึ่งให้ข้อมูลที่จำเป็นแก่นักพัฒนาในการขับขี่อัตโนมัติเพื่อเร่งประสิทธิภาพของการทำซ้ำที่เป็นนวัตกรรมใหม่ | ลิงค์ |
CV | วิดีโอ, รูปภาพ | Argo โดย Argo สหรัฐอเมริกา | ยานยนต์ | Bounding Box, Optical Flow, ป้ายพฤติกรรม, ป้ายความหมาย, Lane Marking | ชุดข้อมูลการขับขี่อัตโนมัติที่ประกอบด้วยแผนที่ HD ที่มีข้อมูลเมตาทางเรขาคณิตและความหมาย เช่น เส้นกึ่งกลางเลน ทิศทางของเลน และพื้นที่ที่สามารถขับได้ ชุดข้อมูลนี้ใช้เพื่อฝึกโมเดล ML เพื่อสร้างอัลกอริธึมการรับรู้ที่แม่นยำยิ่งขึ้น ซึ่งจะช่วยให้ยานพาหนะที่ขับด้วยตนเองสามารถนำทางได้อย่างปลอดภัย | ลิงค์ |
CV | วีดีโอ | สัญญาณไฟจราจรขนาดเล็กของ Bosch โดย Bosch North America Research | ยานยนต์ | กล่องผูก | ชุดข้อมูลที่ประกอบด้วยภาพจากกล้อง 13427 ภาพที่มีความละเอียด 1280*720 เพื่อสร้างระบบตรวจจับสัญญาณไฟจราจรตามวิสัยทัศน์ ชุดข้อมูลนี้มีสัญญาณไฟจราจรที่มีคำอธิบายประกอบมากกว่า 24000 รายการ | ลิงค์ |
CV | วีดีโอ | Brain4Cars โดย Cornell Univ. สหรัฐอเมริกา | ยานยนต์ | ป้ายพฤติกรรม | ชุดข้อมูลที่ประกอบด้วยอาร์เรย์ของเซ็นเซอร์ในห้องโดยสาร (กล้อง เซ็นเซอร์สัมผัส อุปกรณ์อัจฉริยะ ฯลฯ) เพื่อดึงข้อมูลสถิติที่เป็นประโยชน์เกี่ยวกับการเตรียมพร้อมของคนขับ อัลกอริธึมของเราอาจตรวจจับคนขับที่ง่วงหรือฟุ้งซ่าน และเพิ่มสัญญาณเตือนที่จำเป็นเพื่อปรับปรุงการป้องกัน | ลิงค์ |
CV | ภาพ | CULane โดยมหาวิทยาลัยจีน ของฮ่องกง ปักกิ่ง ประเทศจีน | ยานยนต์ | เครื่องหมายเลน | ชุดข้อมูล Computer Vision เกี่ยวกับการตรวจจับช่องจราจร ซึ่งประกอบด้วยวิดีโอ 55 ชั่วโมง โดยได้แยกเฟรม 133,235 (88880 ชุดการฝึก ชุดตรวจสอบ 9675 ชุด และชุดทดสอบ 34680 ชุด) มันถูกรวบรวมโดยกล้องที่ติดตั้งบนยานพาหนะหกคันที่แตกต่างกันซึ่งขับเคลื่อนโดยคนขับที่แตกต่างกันในปักกิ่ง | ลิงค์ |
CV | วีดีโอ | เดวิส โดย ม. ของ Zurich,ETH ¨ Zurich, Germany, Switzerland | ยานยนต์ | ชุดข้อมูลการฝึกขับรถแบบ end-to-end ที่ใช้กล้อง DAVIS event+frame ข้อมูลรถยนต์ เช่น การบังคับเลี้ยว คันเร่ง GPS ฯลฯ ใช้เพื่อประเมินการรวมเฟรมและข้อมูลเหตุการณ์สำหรับแอปยานยนต์ | ลิงค์ | |
CV | วีดีโอ | DBNet โดยมหาวิทยาลัย Shanghai Jiao Tong มหาวิทยาลัยเซียะเหมิน ประเทศจีน | ยานยนต์ | พอยต์คลาวด์, LiDAR | ข้อมูลการขับขี่ระยะทาง 1000 กม. ในโลกแห่งความเป็นจริง ซึ่งรวมถึงวิดีโอที่สอดคล้อง จุดคลาวด์ GPS และพฤติกรรมของผู้ขับขี่สำหรับการวิจัยเชิงลึกเกี่ยวกับพฤติกรรมการขับขี่ | ลิงค์ |
CV | วีดีโอ | Dr(eye)ve โดย ม. แห่งโมเดนาและเรจจิโอ เอมิเลีย เมืองโมเดนา ประเทศอิตาลี | ยานยนต์ | ป้ายพฤติกรรม | ชุดข้อมูลที่มีลำดับวิดีโอ 74 รายการ แต่ละรายการละ 5 นาที ซึ่งมีคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลประกอบด้วยตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ หลักสูตร และยังติดป้ายกำกับการเพ่งสายตาของผู้ขับขี่และการผสานรวมชั่วคราวเพื่อมอบแผนที่เฉพาะงาน | ลิงค์ |
CV | วีดีโอ | คนเดินเท้า ETH (2009) โดย ETH ซูริก ซูริก สวิตเซอร์แลนด์ | General | กล่องผูก | ชุดข้อมูลวิดีโอ 74 ลำดับ วิดีโอละ 5 นาที พร้อมคำอธิบายประกอบในเฟรมมากกว่า 500,000 เฟรม ชุดข้อมูลนี้ระบุตำแหน่งอ้างอิงทางภูมิศาสตร์ ความเร็วในการขับขี่ ทิศทาง และยังระบุการตรึงสายตาสำหรับผู้ขับขี่และการรวมเวลา รวมถึงแผนที่เฉพาะงาน | ลิงค์ |
CV | วีดีโอ | ฟอร์ด (2009) โดย ม. มิชิแกน มิชิแกน สหรัฐอเมริกา | ยานยนต์ | ขอบเขตกล่อง, , LiDAR | ชุดข้อมูลที่รวบรวมโดยยานพาหนะทางบกแบบอัตโนมัติติดอาวุธด้วยเครื่องสแกน Velodyne 3D-lidar, Rieg lidars ที่มองไปข้างหน้าแบบกดไม้กวาดสองตัว, หน่วยวัดแรงเฉื่อยทางเทคนิคและสำหรับผู้บริโภค (IMU) และระบบกล้องรอบทิศทาง Point Grey Ladybug3 | ลิงค์ |
CV | วีดีโอ | HCI Challenger Stereo, Bosch Corporation Research, Hildesheim, Germany | General | ชุดข้อมูลหลายล้านเฟรมจากฉากวิดีโอที่ถ่ายไว้ ซึ่งรวมถึงสภาพอากาศที่หลากหลาย การเคลื่อนไหวและความลึกหลายชั้น สถานการณ์ในเมืองและชนบท ฯลฯ | ลิงค์ | |
CV | วีดีโอ | JAAD โดยมหาวิทยาลัยยอร์ก ประเทศยูเครน แคนาดา | ยานยนต์ | Bounding Box ป้ายพฤติกรรม | "JAAD เป็นชุดข้อมูลสำหรับศึกษาความสนใจร่วมกันในบริบทของการขับขี่อัตโนมัติ โดยมุ่งเน้นที่พฤติกรรมคนเดินถนนและคนขับที่จุดข้ามและปัจจัยที่มีอิทธิพลต่อสิ่งเหล่านี้ ด้วยเหตุนี้ ชุดข้อมูล JAAD จึงนำเสนอคอลเลกชันวิดีโอสั้น 346 ที่มีคำอธิบายประกอบอย่างละเอียด คลิป (ความยาว 5-10 วินาที) ที่ดึงมาจากฟุตเทจการขับขี่กว่า 240 ชั่วโมงจากสถานที่ต่างๆ ในอเมริกาเหนือและยุโรปตะวันออก Bounding Boxes with occlusion tag ใช้สำหรับคนเดินเท้าทั้งหมดทำให้ชุดข้อมูลนี้เหมาะสำหรับการตรวจจับคนเดินถนน คำอธิบายประกอบเกี่ยวกับพฤติกรรมระบุพฤติกรรมสำหรับคนเดินถนน ที่โต้ตอบหรือต้องการความสนใจจากคนขับ สำหรับแต่ละวิดีโอ จะมีแท็กหลายแท็ก (สภาพอากาศ สถานที่ ฯลฯ) และป้ายกำกับพฤติกรรมที่ประทับเวลา (เช่น หยุด เดิน มอง ฯลฯ) นอกจากนี้ รายการคุณลักษณะทางประชากรคือ ให้คนเดินถนนแต่ละคน (เช่น อายุ เพศ ทิศทางการเคลื่อนไหว ฯลฯ) ตลอดจนรายการองค์ประกอบฉากจราจรที่มองเห็นได้ (เช่น ป้ายหยุด สัญญาณไฟจราจร ฯลฯ) ในแต่ละเฟรม" | ลิงค์ |
CV | วีดีโอ | KAIST Urban โดย KAIST ประเทศเกาหลีใต้ | General | LiDAR | การรวบรวมข้อมูลประกอบด้วยเซ็นเซอร์ตำแหน่งจำนวนมากสำหรับข้อมูล LiDAR และภาพสเตอริโอที่กำหนดเป้าหมายไปยังเขตเมืองที่ซับซ้อนมาก (เช่น พื้นที่มหานคร อาคารที่ซับซ้อน และพื้นที่อยู่อาศัย) | ลิงค์ |
CV | ภาพ | ป้ายจราจร LISA โดย ม. แห่งแคลิฟอร์เนีย ซานดิเอโก สหรัฐอเมริกา | ยานยนต์ | กล่องผูก | ชุดข้อมูลที่มีวิดีโอและเฟรมที่มีคำอธิบายประกอบซึ่งมีสัญญาณจราจรของสหรัฐอเมริกา มันถูกปล่อยออกมาในสองขั้นตอน หนึ่งมีเฉพาะรูปภาพและอีกอันที่มีทั้งรูปภาพและวิดีโอ | ลิงค์ |
CV | ภาพ | Mapillary Vistas โดย Mapillary AB, Global | ยานยนต์ | ป้ายความหมาย | ชุดข้อมูลการถ่ายภาพระดับถนนสำหรับการตีความฉากบนท้องถนนทั่วโลกด้วยคำอธิบายประกอบของมนุษย์ที่มีความแม่นยำระดับพิกเซลและเฉพาะอินสแตนซ์ | ลิงค์ |
CV | วิดีโอ, รูปภาพ | Semantic KITTI โดย University of Bonn, Karlsruhe ประเทศเยอรมนี | ยานยนต์ | Bounding Box, Semantic Label, เครื่องหมายเลน | ชุดข้อมูลที่มีคำอธิบายประกอบเชิงความหมายสำหรับลำดับการเปรียบเทียบการวัดระยะทางทั้งหมด ชุดข้อมูลนี้อธิบายการจราจรที่เคลื่อนที่และไม่เคลื่อนที่ประเภทต่างๆ ได้แก่ รถยนต์ จักรยาน จักรยาน คนเดินเท้า และนักปั่นจักรยาน ซึ่งช่วยให้สามารถศึกษาวัตถุในที่เกิดเหตุได้ | ลิงค์ |
CV | วีดีโอ | Stanford Track โดยมหาวิทยาลัยสแตนฟอร์ด สหรัฐอเมริกา | ยานยนต์ | การตรวจจับวัตถุ / การจำแนกประเภท LiDAR, GPS, รหัส | ชุดข้อมูลที่มีแทร็กอ็อบเจ็กต์ติดป้ายกำกับ 14,000 รายการตามที่ Velodyne HDL-64E S2 LIDAR สังเกตในฉากท้องถนนตามธรรมชาติ ซึ่งสามารถใช้เพื่อฝึกโมเดลการเรียนรู้ของเครื่องสำหรับการรู้จำวัตถุ 3 มิติ | ลิงค์ |
CV | วิดีโอ, รูปภาพ | ชุดข้อมูล Boxy โดย Bosch ประเทศสหรัฐอเมริกา | ยานยนต์ | Bounding Box / การตรวจจับยานพาหนะ | ชุดข้อมูลการตรวจจับยานพาหนะที่มียานพาหนะที่มีหมายเหตุ 2 ล้านคันสำหรับการฝึกอบรมและวิเคราะห์กลยุทธ์การจดจำวัตถุสำหรับรถยนต์ที่ขับด้วยตนเองบนทางหลวง | ลิงค์ |
CV | วีดีโอ | TME Motorway โดย Czech Technical Univ. ทางตอนเหนือของอิตาลี | ยานยนต์ | กล่องผูก | ชุดข้อมูล 28 คลิป รวมเวลา 27 นาที แบ่งเป็นเฟรมคำอธิบายประกอบรถยนต์กว่า 30,000 เฟรม สร้างคำอธิบายประกอบแบบกึ่งอัตโนมัติโดยใช้ข้อมูลจากเครื่องสแกนเลเซอร์ การรวบรวมข้อมูลนี้เกี่ยวข้องกับสถานการณ์การจราจรที่แปรปรวน จำนวนเลน ความโค้งของถนน และไฟส่องสว่าง ซึ่งครอบคลุมเงื่อนไขส่วนใหญ่ของการได้มาทั้งหมด | ลิงค์ |
CV | วีดีโอ | Llamas ที่ไม่มีผู้ดูแล โดย Bosch ประเทศสหรัฐอเมริกา | ยานยนต์ | เครื่องหมายเลน LiDAR | ชุดข้อมูล Llamas ที่ไม่มีผู้ดูแลได้รับการบันทึกโดยการสร้างแผนที่การขับขี่อัตโนมัติที่มีความละเอียดสูง ซึ่งรวมถึงเครื่องหมายบอกเลนตาม Lidar รถยนต์ไร้คนขับสามารถจัดวางให้ชิดกับแผนที่เหล่านี้ และเครื่องหมายเลนจะถูกฉายเข้าไปในเฟรมของกล้อง การฉายภาพ 3 มิติได้รับการปรับให้เหมาะสมโดยลดความคลาดเคลื่อนระหว่างเครื่องหมายภาพที่สังเกตแล้วและคาดการณ์ไว้ | ลิงค์ |
NLP | เสียง | Facebook AI LibriSpeech หลายภาษา (MLS) | General | คำอธิบายประกอบเสียง / การรู้จำเสียง | Facebook AI Multilingual LibriSpeech (MLS) เป็นชุดข้อมูลโอเพ่นซอร์สขนาดใหญ่ที่ออกแบบมาเพื่อช่วยให้การวิจัยขั้นสูงในการรู้จำคำพูดอัตโนมัติ (ASR) MLS ให้เสียงมากกว่า 50,000 ชั่วโมงใน 8 ภาษา: อังกฤษ เยอรมัน ดัตช์ ฝรั่งเศส สเปน อิตาลี โปรตุเกส และโปแลนด์ | ลิงค์ |