일단 하고 보는 사람

나중보단 지금에 집중하되, 지금보단 나중에 완벽해지자💪🏻

LLM 11

RAG 성능 최적화: 규칙을 늘릴수록 망가졌던 이유

🧩 배경대화 데이터를 기반으로 특정 기준에 맞는 발화를 찾아내는 작업을 진행했다.기본 구조는 단순했다.등장해야 하는 특정한 키워드 리스트를 기준으로 발화를 검사하고해당 키워드가 모두 포함되면 조건을 충족한 것으로 판단여기에 실제 운영 환경을 반영하면서 조건이 점점 추가됐다.띄어쓰기 차이 허용어근 일치 허용의미 일치 허용숫자/금액/기간 표현 변형 대응(아라비아 숫자)처음에는 자연스러운 확장이라고 생각했다만...결과가 예상과는 너무 달라서,, 진짜 아찔했다. 💭 고민의 내용이상했던 점은 하나였다.단순하게 검색하면 잘 잡히는데,규칙을 넣으면 오히려 못 잡는다..? 예를 들어,특정 키워드 하나로 찾으면 정상적으로 추출됨그런데 여러 조건을 결합하면 동일한 발화가 제외됨(;;;)처음에는 규칙이 부족하다고 생각했..

LLM 2026.04.12

[RAG 서비스별 설계] 세션 기반 RAG vs 단건 질의 RAG, 운영하면서 생긴 차이들

2026-03-02: 작성 (03일 배포)2026-03-03 18시 27분: 단어 '채널'을 '사용 서비스'로 수정 🧩 배경회사에서 내부 지식문서를 기반으로 답변을 생성하는 자유질의 서비스를 운영하고 있다.흥미로운 점은 같은 파이프라인을 공유하면서도 서로 다른 서비스에서 동작 방식이 조금씩 다르다는 거다.외부인의 입장에서 무슨 소리인가 싶을 수도 있겠지만서비스별로 사용 목적에 차이가 있다보니히스토리 사용 여부, 필터 정책, 검색 결과 개수(K라고 하겠다), 프롬프트 커스터마이징 같은 요소들이 자연스럽게 갈라져 있었다. 이에 대한 설명을 듣고 싶어 하는 팀원들에게 로직을 설명하기로 했다.당연하게도 팀원들이 다 같은 일을 하는 것은 아닌 데다, 이 업무는 내가 전적으로 맡았다정작 내가 “왜 이렇게 설계됐..

LLM 2026.03.03

Claudesidian = Claude Code + Obsidian

얼렁뚱땅 신기해서 해보는 클로드 코드 + 옵시디언 연동 삽질기 https://github.com/heyitsnoah/claudesidian GitHub - heyitsnoah/claudesidianContribute to heyitsnoah/claudesidian development by creating an account on GitHub.github.com 1. Git clone git bash 열고,$ git clone https://github.com/heyitsnoah/claudesidian.git obsidian-notesCloning into 'obsidian-notes'...remote: Enumerating objects: 557, done.remote: Counting object..

LLM 2026.01.02

💭 긴 텍스트 벡터화: 벡터화도 결국 사람처럼 "맥락"이 필요하다

https://honge1122.tistory.com/124 [나의 고민] 코드 짜고 나면 항상 찝찝해요요즘 부쩍 고민이 늘어 줄글을 쓰던 날이 늘었다.근데 맘 속의 응어리(?)가 풀리지 않아어떻게 할까 고민하다가이 과정을 나름 정리해서 어딘가 업로드(?)하는 것이 좋을 것 같다는 생각이 들었honge1122.tistory.com위 고민을 기록하고 나서 좋은 점:회사에서 과업을 미리 끝냈을 때 바로 주석으로 달려가서(?) 리팩토링을 할 기회를 get 할 수 있다!!! 🧩 배경 - 왜 이런 고민을 하게 되었는가? (팀 구조, 업무 환경 등)팀에서 내가 맡은 과업 중 하나로, Azure OpenAI 기반으로 LLM 응답을 임베딩/검색 등을 처리하는 로직을 짜야한다.당연한 말이지만 LLM(글 작성기..

LLM 2025.08.17

[오늘의실수]RAG 반환값이 없다⁉️→ 무응답도 응답이다

Tistory에는 너무 오랜만에 기록하는 거 같은데,, 일단 내가 하고 있는 일중 하나는 바로 LLM 데이터 쌓는 작업이다. 자세히 쓸 순 없지만 Azure AI Search에 적재한 HTML 문서에 특정 키워드에 대한 특정 항목을 특정 포맷에 맞춰 요약 출력하는 로직을 구현하다가 겪은 일이다. 📌 LLM 호출 결과의 부재.. 대체 왜?????그렇다. LLM 기반 RAG 로직 짜다가 겪은 일이다.데이터 흐름상 서치필드에 관한 파라미터도 정상적으로 흘러가고, 디버깅 과정에서도 query 값과 document 모두 이상이 없었다.너무 답답해서 각 필드 하나하나 뜯어봤는데 정. 확. 히. 일치했다. 그러나 LLM 호출 이후 반환값과 쿼리가 모두 빈 문자열로 처리되는 현상이 발생했다 😢처음에는 금방 해결할 ..

LLM 2025.06.03

[📘도서리뷰]: Azure OpenAI로 ChatGPT와 LLM 시스템 쉽고 빠르게 구축하기

https://www.aladin.co.kr/shop/wproduct.aspx?itemid=358914912&ptid=14&srsltid=afmboorgmrfnwyrwfvjpj2apzilawcqstkdmzjcqgesyytsnyw2zjths Azure OpenAI로 ChatGPT와 LLM 시스템 쉽고 빠르게 구축하기 : 알라딘단계별로 배우는 효율적인 AI 시스템 구축법. 빠르게 발전하는 AI 기술의 중심에는 마이크로소프트 Azure OpenAI가 있다. 이 책은 실무에서 바로 활용할 수 있도록 생성형 AI와 ChatGPT 모델의 도입부터www.aladin.co.kr 위 책을 읽고 개인적으로 느낀 부분들을 공유해보고자 한다.  ✨ 책을 만나게 된 계기 최근 몇 년 사이 생성형 AI는 단순한 기술 트렌드를 넘..

LLM 2025.03.28

Prometheus

Prometheus시스템 및 서비스 상태를 모니터링하는 오픈 소스 모니터링 도구시스템 모니터링이자 경고 툴킷이다.다양한 대상으로부터 메트릭을 수집하여 시계열(Time Series) DB 형태로 저장 메트릭 수집 = PULL 방식서버가 대상 시스템에서 (주로 HTTP 엔드포인트를 통해) 메트릭을 주기적으로 가져옴알림(alert) 기능이 있다. PromQLPrometheus 쿼리 언어수집된 데이터를 기반으로 쿼리를 실행하고 결과를 Grafana와 같은 시각화 도구를 통해 그래프/대시보드 형태로 볼 수 있는 거다.

LLM 2025.03.04

[Language Model] gpt 사용하기: Model I/O로 무엇을 할 수 있는지❓❓

언어 모델을 호출할 때 입력되는 텍스트를 '프롬프트'라고 한다. https://honge1122.tistory.com/106 [LangChain] Chat 모델 API 호출하기우선 랭체인 말고 파이썬 소스코드를 통해 API 호출을 해보려고 했는데,  openai.error.RateLimitError 에러가 떴다.  1. ⚠️RateLimitError?OpenAI API를 사용할 때 발생하는 오류로, 현재 할당량을 초과했음honge1122.tistory.com예전에 언어 모델 호출 실습으로 썼던 코드를 다시 가져와보겠다.  User라는 role로 gpt-3.5-turbo 모델을 호출해서 텍스트에 대한 결과를 요청하고 있다. 간단한 애플리케이션이면 위처럼 사용해도 큰 문제는 없지만 실제로 언어 모델을 활용한..

LLM 2025.02.05

[OpenAI] Complete 모델 API 호출하기

1. 호출import jsonimport openairesponse = openai.Completion.create( # ChatCompletion이 아닌 Completion 사용 engine="gpt-3.5-turbo-instruct", # model이 아닌 engine을 사용 prompt="오늘 너무 추워서 ", stop=".", max_tokens=50, temperature=0.5, n=2,)print(json.dumps(response, indent=2, ensure_ascii=False)) 요청할 메시지를 messages에 담아 정의하는 Chat 모델과는 달리,Complete 모델을 쓸 때는 prompt로 단일 메시지를 직접 지정한다. ..

LLM 2025.02.05

[LangChain] Chat 모델 API 호출하기

우선 랭체인 말고 파이썬 소스코드를 통해 API 호출을 해보려고 했는데,  openai.error.RateLimitError 에러가 떴다.  1. ⚠️RateLimitError?OpenAI API를 사용할 때 발생하는 오류로, 현재 할당량을 초과했음을 의미한다.속도제한(1분) 기다려라, 토큰 더 적게 해라 등 여러 가지 해봤는데 다 무용지물이었다 ㅜAPI 키도 방금 만들었고, 계정도 문제없는데 뭐가 문제지 서치만 하다가 문득 카드 등록을 안 했다는 사실이 떠올랐다. https://platform.openai.com/settings/organization/billing/overview 소름 돋게도 카드 등록하고(openai한테 팔천얼마 뜯기고) 터미널 명령어 재실행하니까 정상적으로 호출된 것을 확인할 수 ..

LLM 2025.01.15