핵심기술

투블럭에이아이의 자체 보유 NLP 기술은 한국어 심층 언어모델 HanBERT와 HanGPT-2 기반으로 뛰어난 한국어 자연어 처리 기술을 보유하고 있습니다.

NLP AI 기술과 솔루션으로
새로운 경쟁력를 더하세요.

기계가 인간처럼 말하는 방법을 배우는 기술을 자연어 처리(NLP)라고 합니다.  기계가 들은 내용을 처리하고, 받은 정보를 구조화하고, 필요한 반응을 탐색하여 사용자가 이해할 수 있는 언어로 대응할 수 있게 됩니다. NLP는 인간과 기계 사이의 상호작용을 다루는 인공지능(AI)의 한 분야로, 많은 비지니스에서 효과적으로 사용되고 있습니다. 새로운 경쟁력을 원하신다면 답은 인공지능입니다.

CK_ti474a1901

국어 자동 채점 모델

현재 초등학생을 대상으로 할 2028년의 수능에는 서답형 문항이 포함될 전망입니다. 따라서 문해력과 더불어 글쓰기 능력까지 준비해야 합니다. 객관식은 물론 서답형, 논술형 글쓰기에 대한 채점으로 보다 객관적이고 정밀한 평가를 쉽게 할 수 있습니다.

: 멀티 키워드형/의미 유사형/구조 유사형

크리드 독해 지수

독해지수 판별

(주)대교와 함께 개발한 크리드(Kread) 지수란 글의 난이도와 학습자의 읽기 능력 수준을 객관적 수치로 보여 주는 한국어 독해 지수를 말합니다. 지수가 높을수록 글의 난이도가 높고 학습자의 읽기 능력 수준이 뛰어남을 나타냅니다. 

Kread 지수로 2022학년도 수능 국어영역 지문의 난이도를 평가한 바 있습니다.

자산 2ss

채팅 및 챗봇 서비스

‘사용자 간의 채팅 중개’ 서비스’와 텍스트를 통해 기계와 사람이 대화할 수 있는 ‘챗봇’ 기술력을 가지고 있습니다. 2022년 5월, 취업준비생과 현업직원을 중개하고 대화 내용을 챗봇과의 대화를 통해 확인할 수 있는 어플리케이션 ‘인맥스(iNMAX)를 개발하여 배포하였습니다. ‘
구글스토어에서 현재(2022년 6월 기준) 2천 건 이상의 다운로드 수를 기록하고 있습니다.

교육 특화 자연어처리(Edu NLP)

투블럭에이아이는 NLP 전문 기술에 국어 교육 전문가의 기획과 감수를 마친 교육 특화 ‘Edu NLP’를 제공해드립니다.
원하시는 교육 서비스에 대한 상담을 받아보세요. 보다 쉽게, 높은 수준의 교육 환경을 조성할 수 있습니다.

기반 기술

투블럭에이아이가 보유하고 있는 클래식NLP, 머신러닝NLP, 딥NLP은 한국어를 대상으로 한 전문적인 학습 모델입니다. Moran 형태소 분석기와 HanBERT, HanBART, HanGPT 등의 심층 언어 모델을 자체 개발하였으며, 이를 통해 원하는 기능을 빠르고 정확하게 검증하고 구현할 수 있습니다. 본 언어모델은 각종 경진대회 및 NLP Task에서 성능이 검증된 바 있습니다. 
이 밖에도 모델의 성능 향상을 위하여 부산대학교 인공지능연구실과 (주)나라인포크가 만든 ‘한국어 맞춤법 문법 검사기’를 도입하여 보다 수준 높은 한국어 자연어처리 및 교육용 인공지능의 개발이 가능합니다.

NLP 클래식, 머신러닝, 딥러닝

–  학습데이터 100G : 300G에 해당하는 소설, 신문기사, 블로그, 백과사전, Wiki 문서, 기업 고시 정보, 특허 문서 등의 원문
–  한국어 BERT와 GPT-2 Pre-Trained Model
–  Classical NLP : 형태소 분석기, Ngram, 명칭어 사전, Phrase 통계, 감성 분류, 사전
–  Deep learning NLP :  Task Fine tuning, 기계 독해, 요약, 감성 분석 등

응용 기술

탄탄한 기반 기술을 바탕으로 비지니스의 니즈에 맞는 인공지능 서비스가 가능합니다. 특히 에듀테크 분야에서의 다양한 니즈들을 수용할 수 있는 응용 기술을 확보하고 있습니다. 기업에서 원하시는 맞춤 프로그래밍이 가능합니다.

기계 독해(MRC)

심층언어 모델 HanBERT를 활용하여 “주어진 문서나 글에서 질문을 통해 답변을 찾을 수 있도록” 학습한 모델입니다. 답변과 이에 대한 신뢰도까지 확인할 수 있습니다. 질문 당 응답속도는 35ms 수준입니다.

개체명 인식(NER)

심층언어 모델 HanBERT를 활용하여 “주어진 문서나 글에서 개체명(고유 명사, 단위 명사 등)을 구분해내도록” 학습한 모델입니다. 자연어처리 기술의 성능에 큰 영향을 끼치는 핵심적인 기술이라할 수 있습니다.

감성 인식

심층언어 모델 HanBERT를 활용하여 “주어진 문서나 글에서 느껴지는 감성을 분류할 수 있도록” 학습한 모델입니다. 문장이 의미하는 감성을 ‘긍정’과 ‘부정’의 퍼센테이지로 구분합니다. 문장 당 응답속도는 40ms입니다.

자동 지문 생성

자동 글 생성

HanGPT-2를 활용하여 “주어진 문장 이후에 이어질 내용을 NLP모델이 자동으로 생성해내도록” 학습한 모델입니다. 일반 코퍼스, 소설, 특허 문서 등으로 학습하였으며, 매번 다른 내용의 문장을 생성합니다.

자동 문제 생성

자동 문제 생성

HanBERT, Word Embedding, GPT-2를 적용하여 ‘주어진 문서나 글에서 문제를 생성하고 그에 맞는 정답을 도출해낼 수 있도록’ 학습한 모델입니다. ‘단답형의 확인 문제’부터 ‘괄호 안 단어 문제’, ‘문장과 문장 사이의 연결 문장 고르기’ 등의 여러 종류의 문제를 생성할 수 있어 교육 현장에서 교수자의 부담을 줄일 수 있습니다.

독서 지수 측정

독서 지수 측정

심층언어 모델 HanBERT를 활용하여 “주어진 문서나 글을 읽고 글의 장르를 구분하고, 글의 수준(학년 단위)을 측정할 수 있도록” 학습한 모델입니다. 독서 지수 이외에도 ‘표현력’, ‘어휘력’, ‘명료성’, ‘풍부성’, ‘가독성’의 5가지 지표를 통해 글을 정밀하게 분석합니다. 학습자의 글쓰기를 정확하고 즉각적으로 평가, 확인할 수 있습니다.

다중문서요약

다중 문서 요약 및 검증

OCR 후처리와 정보의 선별적 추출 기술을 통해 다중 문서에서 정보를 요약하고 검증할 수 있습니다.
OCR로 스캔된 문서에 대해 오인식된 문자를 교정하거나 띄어쓰기를 자동으로 교정한 후 문서의 양식별 추출 영역을 태그화합니다.
추출 영역에서 정보를 추출한 후, HanBERT를 활용한 기계독해와 개체명 인식으로 문서를 요약합니다.
추가적으로 비지니스 별 검증이 필요한 정보가 있다면 로직에 맞추어 교차로 검증하고 검토 결과를 리포트받을 수 있습니다.

주식회사 투블럭에이아이 | 서울특별시 서초구 남부순환로 350길 54 V타워 1층
대표자 조영환 | 사업자 등록번호 : 316-88-01580 | 통신판매업신고번호 : 2020-서울서초-4283

이것이 좋아요:


%d 블로거가 이것을 좋아합니다: