본문 바로가기

전체 글

파이썬 상태 관리 로직을 활용한 블로그 자동화 파이프라인 통제 방법 블로그 자동화 시스템을 구축하면서 제가 마주한 가장 큰 딜레마는 '완전 자동화'의 위험성이었습니다. 스크립트가 스스로 원고를 작성하고 이미지를 생성한 뒤 곧바로 라이브 서버에 발행(Publish)하도록 놔두었더니, 잘못된 내용이나 깨진 이미지가 그대로 독자들에게 노출되는 대형 사고가 빈번하게 발생했습니다.자동화의 편리함을 누리면서도 품질을 통제할 수 있는 중간 점검 단계가 절실했습니다. 이를 해결하기 위해 파이썬(Python) 기반의 상태 관리 로직과 JSON 리포트 시스템을 도입한 과정을 공유합니다.Dry-run: 발행 전 모의 실행 단계의 도입가장 먼저 취한 조치는 스크립트 실행 모드를 두 가지로 분리하는 것이었습니다. 실제 티스토리 서버에 반영하는 publish 모드와, 모든 유효성을 검증하고 임시.. 더보기
백그라운드 무인 스케줄러 제어 불능 사태와 태스크 종료 실전 가이드 블로그 자동화 파이프라인을 구축하면서 가장 달콤했던 유혹은 '스케줄러'의 도입이었습니다. 파이썬의 schedule이나 운영체제의 크론(Cron) 작업을 활용하면, 컴퓨터가 켜져 있는 동안 매일 정해진 시간에 자동으로 포스팅을 발행할 수 있기 때문입니다.[삽입 이유] 백그라운드 스케줄러 폭주로 인해 시스템 리소스가 고갈되는 심각한 상황을 실제 터미널 에러 로그를 통해 생생하게 전달하기 위함입니다.스케줄러 폭주 터미널 캡처[이미지 해설] 안전 장치 없이 구동된 스케줄러가 동일한 태스크를 무한히 중복 실행하며, 시스템 리소스 고갈 경고 로그를 토해내는 실제 로그 내용을 기반으로 만든 터미널 형식 이미지입니다.하지만 안전 장치 없이 구동된 백그라운드 무인 스케줄러는 순식간에 통제 불능의 좀비 프로세스로 돌변할 .. 더보기
티스토리 React 에디터에서 Selenium 자동 입력이 46자만 들어간 이유와 해결책 파이썬 기반 티스토리 자동 포스팅 봇을 개발하며 수많은 난관에 부딪혔지만, 가장 황당했던 에러를 꼽으라면 단연 "46자 컷오프(Cut-off) 현상"일 것입니다. 수천 자의 정성스러운 원고를 셀레늄(Selenium)에게 쥐여주고 자동 발행을 지시했는데, 정작 발행된 글에는 딱 46자만 적혀 있었습니다.오늘은 이 기괴한 현상의 원인인 'React 에디터의 이벤트 처리 병목'과 이를 해결하기 위해 TinyMCE 코어에 직접 접근하여 문제를 해결한 깊이 있는 트러블슈팅 과정, 그리고 시스템 레벨의 재발 방지 체계 구축 경험을 공유합니다.[삽입 이유] React 렌더링 지연으로 인해 텍스트가 유실되는 컷오프 현상을 마주하고, 이를 구조적으로 해결하려는 의지를 표현하기 위해 본 포스팅의 썸네일을 준비했습니다.[이.. 더보기
티스토리 자동화 중 발생한 마크다운 파싱 오류와 정규식(Regex) 복구 로직 이번 글에서는 파이썬 기반으로 티스토리 자동 포스팅 봇을 운영하던 중 발생한 치명적인 '마크다운 파싱 오류'와 이를 정규식(Regex)으로 해결한 과정을 기록합니다. 자동화 시스템이 뱉어낸 반쪽짜리 원고에 당황했던 경험이 있다면, 이 트러블슈팅 과정을 주목해 주시기 바랍니다.완벽할 줄 알았던 포스팅 봇의 배신수십 줄의 코드를 작성하고 여러 번의 테스트를 거쳐 티스토리 자동 포스팅 파이프라인의 뼈대를 완성했습니다. 하지만 기쁨도 잠시, 봇을 가동하여 새로운 원고를 주입하자마자 에디터 화면을 보고 두 눈을 의심했습니다. 분명히 제가 넘겨준 원고는 기승전결이 갖춰진 긴 글이었는데, 정작 티스토리 에디터에는 글이 중간까지만 적히다 말고 뚝 끊겨 있었기 때문입니다.마치 누군가 가위로 문서를 싹둑 자른 것처럼 기괴.. 더보기
AI 검수 로직을 붙였더니 오히려 작업이 멈춘 이유 안녕하세요. 파이선생 AI 자동화랩의 파이선생입니다.지금까지 블로그 포스팅부터 유튜브 쇼츠 영상까지 다양한 콘텐츠를 자동으로 만들어 내는 파이프라인을 구축해 왔습니다. 처음에는 스크립트가 알아서 글을 쓰고 이미지를 올리는 것만으로도 신기하고 기뻤지만, 횟수가 거듭될수록 예상치 못한 문제들이 터지기 시작했습니다. 자동화 코드가 과장된 광고성 문구를 쓰기도 하고, H1 태그를 남발하여 블로그 글 양식을 깨뜨리기도 했으며, 본문에 들어가야 할 이미지가 엑스박스로 누락되는 등 수많은 오류가 발생했죠.그래서 저는 이 문제를 해결하기 위해 파이프라인 중간에 자동화 검수 스크립트 모듈을 투입하기로 결심했습니다.[자동화 시스템의 검수 모니터링 체제] 끊임없이 발생하는 에러와 품질 저하를 막기 위해, 파이프라인을 철저히.. 더보기
ElevenLabs 한국어 음성이 어색하게 들렸던 이유와 튜닝 기준 ElevenLabs 한국어 음성이 어색하게 들렸던 이유와 튜닝 기준텍스트와 이미지 다음은 목소리였습니다안녕하세요. 파이선생 AI 자동화랩의 파이선생입니다.지금까지 블로그 포스팅을 자동화하고 마크다운 이미지를 연동하는 작업에 집중해 왔습니다. 하지만 텍스트 중심의 블로그를 넘어, 유튜브 쇼츠나 인스타그램 릴스 같은 영상 플랫폼으로 확장하기 위해서는 반드시 넘어야 할 산이 있었습니다. 바로 목소리입니다. 특히 파이선생 AI 자동화랩에서 다루는 기술적인 설명 콘텐츠나 쁘디 채널의 가벼운 정보성 쇼츠 모두, 시청자의 귀를 사로잡고 이탈을 막기 위해서는 자연스러운 내레이션이 필수적이었습니다. 그래서 현재 가장 높은 품질의 AI 음성 합성 서비스를 제공한다고 알려진 ElevenLabs(일레븐랩스)를 도입하여 본격적.. 더보기
마크다운 이미지가 엑스박스로 깨진 이유와 GitHub 이미지 호스팅 실험 마크다운 이미지가 엑스박스로 깨진 이유와 GitHub 이미지 호스팅 실험자동 발행은 성공했지만 이미지가 깨졌습니다안녕하세요. 파이선생 AI 자동화랩의 파이선생입니다.최근 블로그 자동 발행 파이프라인을 구축하면서 가장 당혹스러웠던 순간 중 하나는 바로 본문은 멀쩡하게 올라갔는데 마크다운 이미지가 전부 엑스박스로 깨져서 나타났을 때입니다. 분명 로컬 PC에 설치된 마크다운 에디터에서는 이미지가 아주 선명하게 잘 보였기 때문에, 티스토리 에디터에 코드를 통해 텍스트를 붙여넣기만 하면 이미지 파일들도 알아서 업로드되고 잘 보일 것이라고 막연히 기대했습니다. 하지만 실제로 셀레니움 기반의 자동화 봇을 돌려보니 결과는 전혀 달랐습니다. 텍스트와 코드 블록은 완벽하게 화면에 올라갔지만, 정작 글의 내용 이해를 돕는 .. 더보기
Matplotlib로 그린 트래픽 그래프 글씨가 뭉개지다: DPI 최적화 실패로 쓸모없어진 데이터 시각화 [실패기] Matplotlib로 그린 트래픽 그래프 글씨가 뭉개지다: DPI 최적화 실패로 쓸모없어진 데이터 시각화파이선생의 1인 기업 자동화 생존기안녕하세요! AI 자동화 연구소의 파이선생입니다.혹시 파이썬으로 데이터 분석을 하시면서 엑셀(Excel) 데이터나 웹 크롤링으로 수집한 데이터를 예쁘게 시각화해보려고 하신 적 있으신가요?데이터를 수집하고 전처리하는 과정은 코드가 복잡하고 예외 처리가 많아 고단하지만, 막상 그 데이터가 한눈에 들어오는 아름다운 그래프로 그려질 때의 쾌감은 이루 말할 수 없습니다. 저 역시 이전 편에서 다루었던 Ppedi Market Intelligence 프로젝트의 트래픽 데이터를 파싱하며 인코딩 에러와 싸우느라 진을 뺐지만, "이제 그래프만 그리면 끝이다!"라는 생각에 부푼.. 더보기