korQuAD data set 읽어오기 위해 JSON Parsing
* KorQuAD
KorQuAD
What is KorQuAD 2.0? KorQuAD 2.0은 KorQuAD 1.0에서 질문답변 20,000+ 쌍을 포함하여 총 100,000+ 쌍으로 구성된 한국어 Machine Reading Comprehension 데이터셋 입니다. KorQuAD 1.0과는 다르게 1~2 문단이 아닌 Wikipedia article 전체에서 답을 찾아야 합니다. 매우 긴 문서들이 있기 때문에 탐색 시간에 대한 고려가 필요할 것 입니다. 또한 표와 리스트도 포함되어 있기
korquad.github.io
* JSON 파이썬에서 파싱하기
- Type
- { } : Object Type
- [ ] : Array(List) Type (Key, Value)
- JSON 은 웹에서 데이터 전송 시 많이 쓰이는 형식이다.
- Data (KorQuAD) 가 너무 복잡한 구조이다. {[{{[{ 막 섞인 구조..
- 여기서 특정 wiki text 의 question lists 들만 뽑아내려면 어떻게 해야할까? (2가지 possible solutions so far..?)
- 함수가 있을 것이다.
- editor 로 구조 파악 후 [1]["question"] 식으로?
- 여기서 특정 wiki text 의 question lists 들만 뽑아내려면 어떻게 해야할까? (2가지 possible solutions so far..?)
반응형
'Computer Science > TIL-Today I Learned' 카테고리의 다른 글
CNN에서의 Deconvolution (0) | 2019.09.09 |
---|---|
Linux bash shell on Windows 10 (0) | 2019.09.08 |
(19-09-04) (0) | 2019.09.05 |
(19-09-03) (2) | 2019.09.03 |
m (0) | 2019.04.05 |