본문 바로가기

개발24

ChatGPT과 Langchain를 이용한 나만의 지식검색 챗봇 만들기 지난 포스팅에서 Langchain을 이용한 비즈니스 애플리케이션을 만들기 위해 고민해야 할 점들에 대해 이야기했었습니다. 이번 포스팅에서는 실제로 Langchain을 이용한 비즈니스 애플리케이션이라는 콘셉트로 만든 '나만의 지식검색 챗봇'에 대한 간단한 소개와 데모를 보여드리겠습니다. 기획 의도 '나만의 지식검색 챗봇'은 사실 개인적으로 활용하기 위한 용도로 기획하였습니다. 거의 매일 여러 IT뉴스나 블로그 포스팅을 읽고 있는데 그중에 보관하고 나중에도 읽어볼 만한 링크는 텔레그램에 저장하여 나중에 다시 검색해서 읽곤 하였습니다. (에버노트나 포켓도 사용해 봤지만 PC/모바일 환경에서 가장 간단하게 사용하기에는 개인적으로 텔레그램이 가장 좋았습니다) 하지만 텔레그램의 검색기능이 한글 검색에서는 한계가 있.. 2023. 6. 3.
2023년 4월 4주 인공지능 기술 동향 LLM Stability.ai에서 오픈소스 RLHF LLM 챗봇 StableVicuna를 발표했습니다. LLaMA 13b모델을 기반으로 RLHF방식을 파인튜닝 모델을 사용한다고 합니다. vicuna도 성능이 꽤 좋아서 주목을 받았는데, StableVicuna는 어떤 성능을 보여줄지 기대가 됩니다. 언어모델을 기반으로 한 애플리케이션 개발 프로젝트가 점점 많아지고 있습니다. LLaMA Academy는 LLaMA모델, LoRA기술, LangChain프레임워크등을 활용하여 GPT가 API를 호출하도록 가르칩니다. 특정 API를 지정하면 해당 API를 학습한 LLaMA모델이 생성되며 API를 이용하길 원하는 기능을 입력하면 구현된 코드를 응답해 줍니다. griptape는 LLM파이프라인 DAG를 작성하여 워크플.. 2023. 4. 29.
2023년 4월 3주 인공지능 기술 동향 LLM AI Agent프로젝트가 주목을 받고 있습니다. AI Agent프로젝트가 본격적으로 시작되고 있습니다. AutoGPT와 같은 프로젝트는 '역사상 가장 빠르게 성장하는 GitHub프로젝트로 평가받고 있습니다. BabyAGI, AgentGPT와 같은 유사한 프로젝트도 급속도로 활성화되고 있습니다. AI Agent는 GPT와 같은 언어모델을 이용하여 실제 업무상의 다양한 문제점을 해결하거나 자동으로 업무를 수행하고자 하는 프로젝트입니다. (As AI agents like Auto-GPT speed up generative AI race, we all need to buckle up | The AI Beat | VentureBeat) 물론 AutoGPT의 초기 성과가 과대 평가되어 있다는 의견도 있습니다.. 2023. 4. 23.
Stability.ai, 공개 언어모델 StableLM 공개 Stable Diffusion Moment를 불러왔던 Stable Diffusion을 만든 Stability.ai에서 마찬가지로 공개 언어모델인 StableLM을 공개하였습니다. 현재는 알파 버전으로 3B, 7B 두 개의 모델을 공개하였습니다. 향후 30B 및 65B모델도 공개한다고 합니다. 기본 모델은 CC BY-SA-4.0 라이선스(출처 표기 시 상업적으로 이용 가능)입니다. Github에 공개한 소스는 Apache2.0 라이선스입니다. 오픈 데이터셋인 Pile에 기반으로 학습했지만, 1.5T 토큰으로 3배 더 큰 규모입니다. 데이터셋에 대한 내용은 추후 공개 예정입니다. 자체 설명에 따르면 3B,7B 파라미터 모델은 규모는 작아 보이지만 성능은 좋다고 하는데, 커뮤니티 반응을 보면 vicuna가 좀.. 2023. 4. 20.
2023년 4월 2주 인공지능 기술동향 LLM 구글, 'Bard에 대하여:시작단계의 생성형 AI실험' Databrics, Dolly 2.0 오픈소스로 공개. 세계 최초의 진정한 개방형 인스트럭션 튜닝 LLM을 소개합니다. 가트너, ChatGPT에 대한 7가지 가장 큰 궁금증에 대한 답변 Microsoft, ChatGPT유사 모델을 쉽고 빠르게 학습할 수 있게 해주는 최적화 라이브러리 DeepSpeed공개. DeepSpeed Chat: 모든 규모의 ChatGPT유사 모델에 대해 쉽고 빠르며, 경제적인 RLHF 학습 DeepSpeed Chat Github LLaMA, GPT-J, GPT-2, OPT, Cerebras-GPT, Galactica 등과 같은 LLM을 빠르고 효율적이며 간단하게 미세 조정할 수 있도록 지원하는 오픈소스 프로젝트 xTur.. 2023. 4. 16.
VS Code에서 WSL Remote환경을 이용하여 Java개발 환경 구성하기 최근에 Java 개발 환경을 구성해야 하는 일이 생겼습니다. 한동안 Java에서는 손을 놓고 있었기 때문에 PC에는 JDK도 설치되어 있지 않았습니다. 예전처럼 "Oracle JDK만 설치하고 Eclipse 또는 IntelliJ를 설치하면 되나?"라는 생각도 했습니다만, 이미 WSL 환경에서 개발하는데 익숙해진 몸은 Windows에 JDK 설치하고, 환경변수 잡는 일련의 과정들이 너무 귀찮게 느껴졌습니다. 대규모 개발이 아니라 간단한 테스트 수준의 개발환경을 의도했기 때문에 구성하고자 하는 환경의 목표는 다음과 같았습니다 개발환경은 Windows가 아닌 WSL에 구성할 것 무거운 Eclipse나 유료인 IntelliJ를 사용하지 않고 VS Code를 사용할 것 Java 개발 및 Spring Boot 개발.. 2020. 7. 3.