아르고넷, HWP 텍스트 및 메타데이터 추출기 아파치 재단에 기부

입력 2019-08-20 14:27   수정 2019-08-20 14:54



아르고넷은 아파치 재단에 HWP 파서(텍스트 및 메타데이터 추출 기술) 를 기부 하였다고 20일 밝혔다.

Apache Tika 툴킷은 전 세계 다양한 범위의 기여자가 만들고 유지 관리하는 오픈소스 프로젝트다. 또한 PPT, XLS 및 PDF와 같은 다양한 파일 유형에서 메타 데이터 및 텍스트를 탐지하고 추출하는 것이 특징이다. 이러한 모든 파일 형식은 단일 인터페이스를 통해 구문 분석이 가능하여, Tika는 검색엔진 색인 작성, 콘텐츠 분석, 번역 등에 유용한 기능을 제공한다.

아르고넷 이수명 연구소장은 “이번에 HWP 파서를 아파치 재단 오픈소스 프로젝트에 기부함으로써 보통 수백에서 수천만 원 정도 하는 소프트웨어를 모든 사람들이 무상으로 이용 할 수 있을 것” 이라고 말했다.

한편 아파치 재단(Apache Software Foundation)은 1999년 설립 이후 다수의 중요한 오픈소스 프로젝트를 주도해 오며 빅데이터 분야의 상당히 많은 부분에 이바지하고 있는 재단이다. 아파치 프로젝트는 커뮤니티에 속한 개발자들이 개발하는 소프트웨어는 아파치 사용권 조항에 따라 프리 소프트웨어나 오픈 소스 소프트웨어로 공개 하는 것을 원칙으로 하는 비영리 재단이다.

관련뉴스

    top
    • 마이핀
    • 와우캐시
    • 고객센터
    • 페이스 북
    • 유튜브
    • 카카오페이지

    마이핀

    와우캐시

    와우넷에서 실제 현금과
    동일하게 사용되는 사이버머니
    캐시충전
    서비스 상품
    월정액 서비스
    GOLD 한국경제 TV 실시간 방송
    GOLD PLUS 골드서비스 + VOD 주식강좌
    파트너 방송 파트너방송 + 녹화방송 + 회원전용게시판
    +SMS증권정보 + 골드플러스 서비스

    고객센터

    강연회·행사 더보기

    7일간 등록된 일정이 없습니다.

    이벤트

    7일간 등록된 일정이 없습니다.

    공지사항 더보기

    open
    핀(구독)!