[뉴스] 2020 인공지능 온라인 경진대회 종합 1위 과학기술 정보통신부가 주최하고 NIPA 정보통신 산업진흥원이 주관하여 지난 6월 1일부터 접수를 받아 인공지능 허브를 통해 한 달간 진행한 2020 인공지능 온라인 경진대회에서 인공지능 자연어처리 전문기술 스타트업 투블럭에이아이팀이 종합 1위를 하였다신들의 궁전이란 팀이름으로 참가한 투블럭에이아이 ( 대표 조영환 ) 팀은 총 약 400여개 팀이참가하여 20개 과제 중에서 참가한 과제 계속 읽기

HanBert 패키지 : 상업적 활용 방법

HanBert의 공개 이후에 상업적 활용에 대한 문의가 지속되어서 아래와 같이 HanBert 패키지를 만들어서 기술 지원해드립니다. [참고] TwoBlock Ai가 2020년 Ai 바우처 사업의 공급기업 Pool에 등록되었습니다. [PDF 다운로드] 문의: 070-8728-2233 Email: dykim@tbai.info  담당자: 김동엽 이사

[데모] 기계 독해

글을 읽고 대답을 하는 수준을 알아 볼 수 있도록 데모페이지를 만들어서 보여드립니다 이미 공개되어 있는 HanBert-54kN-MRC의 모델로 제작이 되었습니다. HanBert의 상업적인 활용을 위해서는 [상업적 활용] 을 참고해주세요. 모비젠의 IRIS SaaS 서비스로도 제공되고 있습니다. 데모는 KorQuAD 1.0 수준의 학습셋으로 테이블을 읽는 능력은 포함되어 있지 않지만, 뉴스 기사나 대화 문장에서 질문에 답을 찾아내는 것을 보여줍니다. NER이나 온톨로지“[데모] 기계 독해” 계속 읽기

한국어 BERT, HanBert를 공개합니다.

한국어 BERT와 이를 사용하기 위한 한국어 분석기 Moran, 그리고 기계독해 예제 등이 포함되어 있습니다. HanBert를 이용한 재미있는 [기계독해 데모] 를 방문해 보세요. HanBert의 상업적인 활용을 위해서는 [상업적 활용] 을 참고해주세요. 검색이나 홈페이지에서 찾으신 분은 읽어보신 후에 맨 아래 링크에서 다운로드 해주세요. HanBert-54kN – GitHub 로 가기 HanBert-54kN [다운로드] 구글 드라이브에서 다운로드 됩니다. Pre-trained Hangul-BERT (HanBert-54kN)“한국어 BERT, HanBert를 공개합니다.” 계속 읽기

[뉴스] 투블럭에이아이 특허출원 정부기관과 투자사들은 객관적인 평가를 위해서 일정 수준의 Spec을 요구합니다. 그중에 하나가 지적자산이 특허입니다. 많은 경쟁자들 중에서 공정성있는 평가를 했다는 나름의 기준이 있어야 하니까 어쩔 수 없는 것 같습니다. 그래서 3개의 특허를 출원했습니다. (2019. 12) 딥러닝 학습을 위한 한국어 표기 방법 (출원번호 10-2019-0177174) 딥러닝을 위한 한국어 코퍼스는 어떻게 구성이 되어야 할까? 명사 “가”와 계속 읽기

[공유]한국어 BERT, HanBert의 개발 과정과 KorQuAD 2.0 PDF 다운로드 “Bert를 직접 만들어보고, MRC(기계독해)에 적용하여 보았습니다. 솔직히 많이 놀랬습니다. NER(Named Entity Recognition)이 꼭 필요하다고 생각하고 있었고, 날짜를 알아내기 위해서는 Chunking 수준이라도 한국어 분석이 필요한 줄 알았습니다. 그런데… 그런 것이 없이도 잘 나옵니다. 너무 쉬운 방법인데도, 결과가 잘 나옵니다. 형태소 분석에서 실패를 해도 크게 영향을 받지 않았습니다. 계속 읽기

[뉴스] TBai가 KorQuAD 2.0 리더보드에 올라갔습니다. 개방형 경진대회 사업화 지원금 1.6억원을 총 투입해서 세차례에 걸쳐서 총 20개 이상의 한국어 Bert를 구웠는데, 3번째로 구웠던 가마에서 괜찮은 모델이 나왔습니다. 이름을 HanBert라고 하였고 사전과 크기에 따라서 이름을 붙쳤습니다. HanBert-54kN이라는 친구의 이름에서 54k는 54000개의 사전 표제어, 90k는 90000개의 사전표제어를 의미합니다. N은 Normal Size, S는 Small Size, ML은 Medium Large를 계속 읽기

[공유]모란소프트의 추억 우리나라에 2005년부터 2013년까지, 한국어 처리를 전문으로 하였던 회사가 있었습니다. 1995년도에 검색 솔루션을 위한 한국어 색인어 추출기를 개발하여, 여러 솔루션 회사와 네이버/다음 등의 검색포탈에 제공하였고, 여러가지 한국어 처리에 관련된 기술을 공급했던 회사 입니다. [모란소프트] 홈페이지 (CLICK) 2014년에 대표가 프랑스로 잠시 이주를 하면서, 사업은 중단되었었습니다. 그 모란소프트의 제품과 기술 그리고 소프트 자산을 (주)투블럭Ai가 양도받았습니다. 관련된 계속 읽기

[뉴스] TBai가 2019년 개방형 경진대회 우수기업 사업화 지원 사업에 선정되었습니다. 저희 팀이 AI 프로그래밍 경진대회를 통해서 예선을 통과 하였고, 사업 아이템 발표 심사를 통해서 최종 선정이 되었습니다. 저희 팀이 도전한 문제는 “뉴스 기사”를 AI가 읽고 “질문”에 “대답”하는 것입니다. 보통 MRC – Machine Reading Comprehension, 기계 독해 – 라고 하는 분야입니다. 전통적으로 컴퓨터를 이용해서 사람의 언어를 계속 읽기