데이터셋(Data set)

흩어진 데이터를 하나의 주제에 맞춰 정비하여 분야별 혹은 주제별로 모아놓은 데이터 집합체.

이를 활용하여 인공지능(AI), 머신러닝 등의 알고리즘 구축.

미국에는 ‘괴짜(geek)들의 UFC(종합격투기대회)’라고 불리는 머신러닝 및 데이터 사이언스 경진플랫폼인 캐글(Kaggle)이 있고, 우리나라에는 캐글을 벤치마킹해 2018년에 설립된 국내 데이터 사이언스 경진 플랫폼인 데이콘(Dacon)이 있음