Tech News

제목Paper to HTML - 논문을 읽기편한 HTML로 변환2021-09-25 23:44
작성자 Level 10

https://papertohtml.org/ 

- 머신러닝을 이용하여 PDF, LaTeX, PubMed Central XML 의 내용을 읽어서 HTML로 변환

- 접근성 증대 목적

- AI 기반 연구자료 검색엔진인 Semantic Scholar 의 실험적 프로토타입

- 현재는 추출된 이미지/콘텐츠만 캐슁하며, 똑같은 문서를 업로드한 사람에게만 빠르게 서비스하는 용도로 사용됨. 업로드한 파일은 보관하지 않음

- 제한 사항

ㅤ→ 표(Table)는 이미지로 추출 됨

ㅤ→ 수학(Math) 콘텐츠는 정확도가 낮거나 거의 추출되지 않음

ㅤ→ LaTex/PubMed 처리는 PDF보다 기능이 일부 부족할 수 있음

- 차후에 Semantic Scholar 에 접근성 기능을 추가할 계획을 가지고 있음

G
M
T
Y
Text-to-speech function is limited to 200 characters
댓글
자동등록방지
(자동등록방지 숫자를 입력해 주세요)