본문 바로가기
Computer Science/TIL-Today I Learned

python 에서 JSON parsing

by Tanya 탄야 2019. 9. 7.

korQuAD data set 읽어오기 위해 JSON Parsing 

 

* KorQuAD 

https://korquad.github.io/

 

KorQuAD

What is KorQuAD 2.0? KorQuAD 2.0은 KorQuAD 1.0에서 질문답변 20,000+ 쌍을 포함하여 총 100,000+ 쌍으로 구성된 한국어 Machine Reading Comprehension 데이터셋 입니다. KorQuAD 1.0과는 다르게 1~2 문단이 아닌 Wikipedia article 전체에서 답을 찾아야 합니다. 매우 긴 문서들이 있기 때문에 탐색 시간에 대한 고려가 필요할 것 입니다. 또한 표와 리스트도 포함되어 있기

korquad.github.io

 

* JSON 파이썬에서 파싱하기 

  1.  Type
    • { } : Object Type 
    • [ ] : Array(List) Type (Key, Value) 
  2. JSON 은 웹에서 데이터 전송 시 많이 쓰이는 형식이다. 
  3. Data (KorQuAD) 가 너무 복잡한 구조이다. {[{{[{ 막 섞인 구조.. 
    • 여기서 특정 wiki text 의 question lists 들만 뽑아내려면 어떻게 해야할까? (2가지 possible solutions so far..?)
      1. 함수가 있을 것이다. 
      2. editor 로 구조 파악 후 [1]["question"] 식으로? 

 

 

 

 

반응형

'Computer Science > TIL-Today I Learned' 카테고리의 다른 글

CNN에서의 Deconvolution  (0) 2019.09.09
Linux bash shell on Windows 10  (0) 2019.09.08
(19-09-04)  (0) 2019.09.05
(19-09-03)  (2) 2019.09.03
m  (0) 2019.04.05