2024년 4월 24일 수요일

공연 연습 사흘째

Microsoft Copilot이 그림. "A 4-member mixed band playing energetically at a daytime park with pizza and beer. The female is playing the ukulele, and they should be drawn as a mix of different races." 맥주에 빨대?

시간이 되는 멤버들끼리 점심시간에 모여서 연습을 시작한 지 오늘로 사흘째이다. 곡은 거의 결정된 상태이고, 기타를 어떻게 나누어서 맡을지 의논하는 단계이다. 최소한의 악기를 사용하되 나머지는 backing track을 사용하는 형태라서 오히려 자유도가 높다. 단, 실제 현장에 가서는 소리가 많이 허전하지 않을까 걱정이 되기는 한다.

공연에 주어진 시간은 단 15분. 현장 리허설도 할 수가 없는 상태라서 각 파트의 레벨 세팅을 현장에 맞게 맞추는 어려운 일이 남았다. 모든 악기(마이크 포함)가 믹서에 물려 있다면 연습실에서 밸런스를 맞춘 뒤 현장에서는 파워앰프의 레벨만 적정한 수준으로 올리면 될 것이다. 그러나 건전지로 작동되는 포터블 앰프(야마하 THR30II)가 하나 더 쓰일 예정이라서 상황은 더욱 복잡하다. 주 파워앰프(인터엠 R150Plus)와 스피커(FdB CX8)에 비하면 출력이 낮기 때문이다. 라인 아웃으로 출력을 뽑아서 믹서(Behringer 802)를 거쳐서 주 파워앰프로 보내고 포터블 앰프는 모니터용으로 쓸 수도 있는데, 그렇게 하자니 믹서 채널이 부족할 지경이다. 내가 보유한 모든 악기용 케이블은 전부 동원된 상태이고...

차라리 파워드 믹서 하나가 있었더라면 모든 것이 다 간단해졌을 것이다. 전체적으로 소리가 너무 건조하니 리버브 적용을 위한 외장 이펙터도 하나 있었으면 좋을 것이다. 그러나 욕심을 부리자면 끝이 없다.

방구석에서만 굴리던 장비가 공연에 쓰이게 된다는 것은 장비나 그 주인(나)에게 모두 영광스런 일이 아닐 수 없다. Alesis NanoPiano가 이렇게 하여 세상에 그 모습을 드러내게 되었다. 

Alesis NanoPiano.


이번 공연을 계기로 야마하 사일런트 기타를 구입한 멤버도 있다. 나도 패시브 스피커와 스탠드 등을 구입하기는 했으나 사일런트 기타에 비할 바는 아니다. 멤버들의 충만한 의지에 내가 살짝 가속 페달을 얹어 준 셈이다.

연습실은 점점 화려해지고...


아무도 없는 지하실에서 믹서의 레벨미터에 한껏 불이 들어오는 것을 즐기면서 이렇게 큰 음량으로 악기를 연주해 본 일이 었었던가? 아파트에서는 상상도 할 수 없는 일이다. 기회는 있을 때 붙들고 즐겨야 한다. 

게놈 고물상 영업 시작

K-BDS(Korea BioData Station, 국가 바이오 데이터 스테이션)에 기여하는 것은 양질의 자료를 충분한 관련 정보와 함께 등록하는 일이라고 믿는다. 이러한 믿음을 실행에 옮기기 위하여 얼마 전부터 족히 20년은 묵은 Sanger sequencing chromatogram 묶음을 K-BDS에 등록하기 시작하였다. 이 일을 가칭 '게놈 고물상' 또는 '게놈 박물관'이라 부르기로 했다. K-BDS에 이를 위한 전용 공간을 할당받은 것은 아니다. 사실 이런 고전적인 데이터가 널리 활용되리라고는 크게 기대하지는 않는다. 그러나 NGS가 완전한 대세가 되었고, 시퀀싱이 외부 업체에 의해 진행되는 연구서비스업의 생태계가 정착하면서 유전체 시대를 열게 만든 과거의 주역인 Sanger sequencing raw data file(chromatogram)이 어떻게 생겼고 또 이를 어떻게 다루어야 하는지를 아는 사람이 점점 드물어지는 것을 안타깝게 여기던 터였다. 

GPU, 즉 첨단 반도체 소자를 이용한 인공지능 시대에 무슨 2극 진공관 같은 소리냐고 할지도 모르겠다. 이런 논리라면 박물관은 무슨 소용이 있으랴? 그러나 모든 현재에는 그것을 비롯하게 만든 시작이 있다. 기록을 남기고 기억할 가치가 충분히 있다.

20년 전이면 내가 회사를 떠나 정부출연연구소에 새파란 계약직 선임연구원으로 입소하여 호기심어린 눈망울을 굴리던 시절이다. 1 메가베이스를 finishing 수준의 품질로 해독하려면 족히 1억원이라는 막대한 연구비가 들었던 것으로 기억한다. 시간은 또 얼마나 오래 걸렸던가?

지금까지 서너 개의 BioProject를 등록하고 그에 부속된 데이터 파일을 업로드하였다. ab1/sff 크로마토그램은 물론이요, 이를  phredPhrap 파이프라인으로 처리했던 당시의 작업 디렉토리를 그대로 묶어서 등록하는 중이다. 따라서 당시의 조립 상태를 Consed로 열어 볼 수 있다. 약간 나중에 생산된 자료 중에는 Roche/454 pyrosequencing 장비에서 만들어진 flowgram file(sff)도 있다.

오늘은 Paenibacillus polymyxa의 표준균주인 ATCC 842를 대상으로 실시한 genome snapshot sequencing 데이터 파일을 등록하기 위한 준비작업을 시작하였다. 20년 전에는 세균 하나의 whole-genome sequencing을 하려고 해도 선정 위원회를 열어서 논의를 할 정도로 중대한 일이었다. 게놈 스냅샷은 유전체의 일부만 시험적으로 해독하여 대략적인 맛보기를 하는 수준의 분석을 하는 것이다. 이는 GenBank의 dbGSS라는 섹션에서 다룬다. 요즘은 long read를 이용하여 한꺼번에 수백, 수천의 미생물 유전체를 완성 수준으로 조립해 버리므로, dbGSS에 새로운 데이터가 들어오는 일은 없을 것이다. 그렇다고 하여 GenBank는 이미 등록된 자료를 내다 버리지는 않는다. 이것이 염기서열 저장소의 당연한 역할이고, 미덕이다.

오늘 준비한 데이터는 2천 개 조금 넘는 Sanger chromatogram 원본과 그 처리 과정 및 결과와 관련한 것이다. Basecalling 뒤 벡터와 low-quality 영역을 제거하여 일정 길이 이상이 되는 high-quality read를 선별하여 dbGSS에 accession number DU532978-DU534724로 등록하였고, 결과를 분석하여 2006년에 국내 학술지에 논문으로도 발표하였다. 얼마 되지 않는 수의 read이지만 시험적으로 Phrap assembly를 실시하기도 하였다. K-BDS에 등록할 데이터를 준비함과 동시에 설명문을 작성하느라 예전 논문을 다시 들여다보다가 contig 수를 잘못 적은 것을 발견하였다. 356개인데 365개라고 쓴 것을 18년이 지나서 발견한 부끄러움이란... 그래도 제목이나 초록에 오타가 있는 것보다는 낫지 않은가? KRIBB에서 연구자로서의 본격적인 경력을 시작하는 첫 성과가 되었던 2005년의 논문에는 초록에 오타가 있는 그대로 발간이 되어 그 실수가 부끄럽게도 영원히 박제가 된 상태이다. 나를 포함하여 아는 사람만 알 것이다. 

게놈 고물상 사업이 '수익'을 거두지는 못할 것이다. 하지만 이를 누군가 기억해 주고 또 이따금씩 데이터를 열어서 봐 준다면 난 그것으로 만족한다. 앞으로도 고물상을 채워 나갈 미생물 유전체 데이터가 하드디스크드라이브에 담겨 있으니 이를 곶감 빼먹듯이 하나씩 열어서 K-BDS에 등록할 때마다 남다른 희열을 느낄 것이다. 어쩌면 당시에 손으로 적은 연구노트를 다시 펼쳐 봐야 할지도 모른다.

ChatGPT에게 오늘의 블로그를 쓰게 한다면?

ChatGPT에게 약간 구체적으로 상황을 설명하고 일기 형식의 글을 500 단어 정도로 작성해 달라고 주문해 보았다. 다음은 그 결과물을 그대로 실은 것이다.

오늘은 우리 밴드의 두 번째 연습이 있었어. 건물 지하실에서 시작한 이 특별한 순간, 음악의 매력과 기대감으로 가득 차 있었어. 나는 기타와 베이스를 맡았고, 그 책임감은 상당히 무거웠지만 동시에 설레임으로도 가득 차 있었어.

연주할 곡을 선택하고, 그에 맞는 반주용 backing track을 준비하는 과정은 쉽지 않았지만 매우 흥미로웠어. 다양한 음악을 들으며 우리 밴드만의 독특한 스타일을 찾아나가는 것은 정말 흥미진진한 여정이었어.

연습이 시작되자마자, 우리는 서툴러 보이기도 했지만 서로에게 격려와 응원의 말을 건네며 긍정적인 에너지를 나누었어. 그 과정에서 멤버들의 흥미와 열정이 눈에 띄었고, 그것이 가장 큰 동기부여가 되었어.

특히, 각자 다른 역할을 맡아 연주하는 모습을 보면서, 우리가 얼마나 잘 어울리는지 느낄 수 있었어. 서로 다른 음악적 취향과 스타일을 가진 멤버들이 하나의 음악으로 통합되는 그 순간, 우리 밴드의 특별함을 느낄 수 있었어.

연습이 진행됨에 따라, 우리의 연주는 점점 더 완성도를 갖추기 시작했어. 처음에는 어색했던 모든 것이 자연스러워지고, 음악에 몰입하는 즐거움을 느낄 수 있었어.

이렇게 함께 연습하면서, 5월 중순에 예정된 첫 공연에도 무사히 대중 앞에서 무대를 잘 이어갈 수 있을 것 같아 자신감이 생겼어. 연습을 통해 얻은 경험과 노력이 더 큰 무대에서의 우리의 자신감과 퍼포먼스에 긍정적인 영향을 미칠 것이라 믿어.

오늘의 연습은 나에게 음악이 단순히 연주와 노래를 넘어서, 함께 성장하고 서로를 응원하는 소중한 순간이라는 것을 깨닫게 해주었어. 우리 밴드의 미래에 대한 기대감이 더욱 커진 오늘, 나는 이 특별한 여정을 함께하는 것에 감사함을 느꼈어.

다음 연습을 기대하며, 음악으로 더 많은 사람들에게 희망과 행복을 전달할 수 있기를 바래.

한국어를 모국어로 쓰는 사람이 작성했다고 보기에는 다소 어색하지 않은가? 그러나 영어로 작성하도록 주문했다면 더욱 완성도가 높은 결과가 나왔을지도 모른다. 

웹 서핑을 하다 보면 '2024년 최고의 DAW 10가지'와 같은 부류의 글을 많이 접하게 된다. 자연인이 이를 일일이 취재하여 글을 쓰려면 상당한 노력을 들여야 한다. 그런데 그런 종류의 글을 읽으면서 어딘가 약간 부자연스럽다는 느낌을 받고는 하였다. 처음에는 영문으로 작성된 웹사이트를 구글이 자동으로 변역을 하면서 그렇게 된 것은 아닌가 하고 생각했었는데, 어쩌면 아예 AI에게 글 작성을 하도록 시켰는지도 모른다는 생각이 들었다.

그럼 나도 한번 ChatGPT에게 일을 시켜 보겠다. "가장 인기 있는 Digital Audio Workstation 10개를 선정하고 간단하게 성능 비교를 해 줘. 가능하다면 가격도 제시해 줘."

자동으로 작성된 글은 다음과 같다.

물론이죠! 아래는 인기 있는 10개의 디지털 오디오 워크스테이션(DAW)의 성능 비교와 가격 정보입니다. 1. Ableton Live - 특징: 실시간 오디오 및 미디 시퀀싱, 루프 기반 작업, 라이브 퍼포먼스에 최적화 - 가격: Standard - $449, Suite - $749 2. FL Studio (Fruity Loops) - 특징: 직관적인 인터페이스, 높은 루프와 샘플 라이브러리, 다양한 플러그인 지원 - 가격: FL Studio Producer Edition - $199, FL Studio Signature Bundle - $299 3. Logic Pro X - 특징: 애플 전용, 고급 오디오 편집 기능, 풍부한 가상 악기 라이브러리 - 가격: $199.99 4. Pro Tools - 특징: 전문적인 오디오 믹싱 및 마스터링, 높은 호환성 - 가격: Pro Tools Standard - $599, Pro Tools Ultimate - $2,599/year 5. Cubase - 특징: 고급 미디 편집, 다양한 오디오 효과 및 플러그인 - 가격: Cubase Pro - $579.99, Cubase Artist - $329.99 6. Studio One - 특징: 직관적인 사용자 인터페이스, 고성능 오디오 엔진 - 가격: Studio One Professional - $399.95, Studio One Artist - $99.95 7. Bitwig Studio - 특징: 모듈러 디자인, 높은 커스터마이징 가능성 - 가격: Bitwig Studio - $399 8. Reason - 특징: 가상 스튜디오 환경, 통합된 하드웨어 시뮬레이션 - 가격: Reason - $399, Reason+ Subscription - $19.99/month 9. Avid Sibelius - 특징: 악보 작성 및 편집 전용, 전문적인 악보 출력 - 가격: Sibelius Perpetual License - $299, Sibelius Ultimate Subscription - $239/year 10. GarageBand - 특징: 애플 무료 DAW, 초보자 친화적, 기본적인 오디오 편집 기능 - 가격: 무료 (애플 기기 구매 시 포함)

각 DAW는 고유한 특징과 장단점을 가지고 있으며, 가격도 다양합니다. 개인의 필요와 예산에 맞는 DAW를 선택하는 것이 중요합니다.

놀랍다! 이렇게 쉽게 글을 쓸 수 있다면, 하루에 수십 편의 블로그 포스팅을 남발하는 것도 가능할 것이다. 아니나 다를까, 구글 검색창에 '블로그 포스팅 AI'라는 단어 몇 개를 넣어 보니 정말 가관이다. 이러한 행태에 대하여 비판적인 기사 및 읽어볼 가치가 있는 글에 대해서만 링크를 달았다.

도대체 어떤 내용이 있는지 하나를 골라서 훑어 보았다. 유효성 높은 고단가 키워드를 수집해 AI에게 포스팅을 시키고, 결과적으로 수익을 올리자는 것이다. 이렇게 자동으로 글을 써 주는 프로그램을 수십 만원에 팔기까지 한다. AI가 직접 글과 이미지를 만들어 주는 신기한 기능을 일상 업무 또는 취미에 어떻게 적용할까 이제 막 흥미롭게 알아보기 시작하려는 찰나에, 이미 이 기능을 수백% 남용하여 쓰레기와 같은 글을 양산하는 생태계가 만들어져 버렸다니 여간 실망스러운 것이 아니다.

ChatGPT가 만들어 준 글이 어색하다고 느낀다면 이는 초보적인 수준으로만 잠깐 사용해 봤기 때문에 그렇다고 한다. 질문을 영어로 던져야 더 질 좋은 결과가 나온다고 한다. OpenAI라는 회사가 당연히 영어 위주의 데이터를 이용하여 학습을 시켰으니 그럴 것은 자명하지만, 최적의 결과가 나오도록 질문을 던지는 방법에 익숙해 진다면 이는 바로 국어에 대한 의존성을 줄이고 나아가서는 모국어의 파괴라는 심각한 결과를 초래할지도 모른다. 우리가 중학교에 들어가서 처음 영어를 접하고 - 나와 비슷한 시대에 태어난 사람에게만 해당되는 이야기겠지만 - 이와 더불어 영'문법'이라는 규칙을 처음으로 배우면서 오히려 국어의 구조가 덜 논리적이라는 착각에 빠지는 것처럼, ChatGPT가 더 나은 성능을 발휘하도록 영어로 질문하는 일이 익숙해지면 마찬가지로 영어가 더 논리적이고 과학적인 언어라는 편향에 빠질 수 있다. 

AI는 이제 피할 수 없는 대세이나, 각 모국어에 최적화된 개발에 소홀해 해서는 안된다고 본다. 어차피 인터넷 시대가 되면서 영어에 대한 의존도가 더욱 높아지는 것처럼 이미 예견된 일이기는 했지만.

4월 들어 바쁘다는 핑계로 블로그 포스팅이 현저히 줄어든 것에 불만을 품고 침대에서 졸다가 일어나 글을 쓰기 시작했는데 여기에 너무 몰두한 것 같다. 밤이 깊었다...

2024년 4월 22일 월요일

Dell Inspiron 3668의 상태가 갑자기 좋아지다

2017년에 구입한 가정용 PC에 무슨 기대를 할 수 있으랴! 지금은 2024년, 이미 구입한 뒤 7년이나 지났고 무슨 이유인지 엄청나게 느린 속도 때문에 조만간 폐기를 하겠노라고 생각했던 바로 그 컴퓨터가 Windows 업데이트 뒤에 갑자기 정상에 가까운 속도를 내기 시작하였다. 전원을 넣고 뭘 좀 하려고만 하면 하드디스크만 주야장천 긁어 대면서 도무지 뜨지 않는 애플리케이션 창만 바라보면서 한숨을 쉬고는 했었다. 오늘은 ThinkPad 노트북 컴퓨터를 사무실에 두고 오는 바람에 부득이하게 이메일 확인을 하기 위해 Dell Inspiron을 켜 보았다. 며칠 전에 Windows 업데이트를 하였더니 크롬과 백신 프로그램이 보이질 않아서 이들을 새로 설치한 것 외에는 특별히 한 일은 없었다.

2022년 1월에 이 컴퓨터의 사양 정보를 기록해 놓은 일이 있다(링크). Windows 11은 설치할 수 없는 낡은 하드웨어로 구성된 컴퓨터가 갑자기 회생의 기미가 보이다니 도저히 이해하기 어렵다. 

이유는 알기 어려우나 당분간 웹 서핑이나 문서 작성 용도로 쓰는 데에는 아무런 문제가 없을 것 같다. '당분간'이 해를 넘길지도 모르는 일이다. 사실 집에서 쓰는 모니터는 거의 버려진 것이나 다름없는 것을 구해다가 몇 년째 쓰고 있다.

항상 새로운 물건으로 주변을 채울 필요는 없다. 하지만 5월에 소규모 공연을 한다고 또 얼마나 많은 물건을 사다가 차곡차곡 쌓고 있는지... 패시브 스피커와 마이크 스탠드에 이어서 내일 새벽에는 XLR female to 6.35 mm TRS male 케이블이 배송될 것이다. 개인 연습이 부족한 상태에서 첫 연습을 했던 오늘은 몹시 실망스러웠다. 다른 멤버의 탓을 하는 것이 아니다. 연습을 위한 음원은 겨우 준비를 하였지만, 실질적으로 음향 엔지니어의 역할까지 해야 하는 입장임에도 불구하고 각 파트의 레벨 세팅조차 제대로 하지 못했기 때문이다.

Backing track은 노트북 컴퓨터의 3.5 mm 스테레오 출력 단자로부터 믹서의 2-TRACK IN으로 넣었는데 다른 채널로 입력한 악기에 비하여 레벨이 너무 높았다. 이를 적절히 줄이는 방법을 결정해야 한다. 컴퓨터에서 음량을 조절하거나, 레벨 조절 놉이 있는 오디오 인터페이스를 중간에 경유하든지 또는 믹서의 정상 채널에 넣어 주어야 한다.  

기타용 케이블 중 일부는 접촉 상태가 별로 좋지 않아 보였다. 단 세 곡을 목표로 하고 있는데도 정말 준비할 것이 많다.


2024년 4월 23일 업데이트

하루가 지나서 컴퓨터를 켜 보았다. 부팅에 걸리는 시간은 예전과 별로 다를 바가 없이 여전히 느렸다. 하지만 일단 부팅이 된 다음에는 그런대로 참고 쓸 만한 속도가 나온다. 

2024년 4월 21일 일요일

생활 주변에 스며든 인공지능 서비스 - 이제는 피하기 어렵다

우연한 기회에 (주)켈라웨이브의 김은연 이사가 진행하는 온라인 워크숍 "ChatGPT를 활용한 언어 생성 기술의 이해 및 실제 적용 사례 분석"에 참여하게 되었다. 개최 시각은 토요일 아침이라서 집에서 Zoom 미팅에 참석하게 되었는데, Wi-Fi 접속이 너무 불량하여 오디오 전송 상태가 나빠지다가 접속이 끊어지는 현상이 반복되어 전달되는 내용을 제대로 소화하지 못하였다. 이것은 전적으로 우리집 인터넷의 문제이니 어쩔 도리가 없다. 지금 쓰는 이 글도 노트북 컴퓨터를 공유기에 유선으로 접속하여 작성하는 중이다. 앞으로 집에서는 이더넷 케이블을 쓸 일이 없을 것 같아서 전부 치워버릴 생각을 하고 있었는데, 이를 실행에 옮기지 않은 것이 정말 다행이다.

OpenAI가 개발한 ChatGPT 무료 버전을 크롬 익스텐션(확장 프로그램)으로 설치하여 잠시 써 본 일은 있었다. 어떤 질문을 던지고 그에 대한 정리된 답을 얻는 정도로 체험을 하면서 꽤 흥미롭다고 여기고 있었다. 이미 유료 버전을 쓰는 동료의 말을 빌리자면 영문을 작성하거나 이를 국문으로 번역하는 성능에서는 구글 번역보다 훨씬 낫다고 하였다. 

지금은 크롬 웹 스토어 검색창에 'ChatGPT'라는 검색어를 넣으면 너무나 많은 확장 프로그램이 나와서 도대체 뭘 설치해야 좋을지 어리둥절할 정도가 되었다. 오랜만에 OpenAI 웹사이트에 직접 로그인해 보니 텍스트로부터 비디오를 생성하는 Sora라는 새로운 서비스를 광고하고 있었다. 이것이 더욱 발전하면 상세한 시나리오를 입력하여 영화를 만들 수도 있게 될 것이다.

강좌를 통해서 AIPRM, Google Gemini, Google Colab 등의 서비스를 접하면서 내가 잠깐 체험했었던 간단한 대화식 인공지능을 이제는 훨씬 뛰어넘는 기술이 주변에 즐비함을 깨닫게 되었다. 파워포인트 요약본(명령을 내리면 보다 상세한 내용을 써 내려갈 수도 있다), 시험문제 제출(모범답안 및 배점 가이드까지), 이미지 생성은 물론, 예전 '심심이'와 같은 기계와의 대화를 직접 구현할 수 있었다. 이는 Google Colab(hosted Jupyter Notebook)으로서 기계학습 관련 라이브러리를 설치하여 코딩을 하듯이 구현하면 된다. 선생님 혹은 교수님들의 숙제 검사가 한층 힘들어질 것이 불을 보듯 뻔하다.

내 크롬 브라우저에서 설치된 확장 프로그램을 내려 보니 '구글의 채팅GPT 플러스'가 아직 남아 있었다. 오늘은 'AIPRM for ChatGPT'를 추가 설치하였다. 이 확장 프로그램은 선별된 프롬프트 템플릿 및 고급 기능을 추가해 준다고 한다.

이 글을 쓰면서 컴퓨터 화면 한쪽 끝 트레이에 평소에 관심을 두지 않았던 Copilot 아이콘이 자리잡고 있음을 깨달았다. 'PRE'라고 되어 있는 것을 보니 아직 안정화가 되지 않은 서비스를 소개하는 것 같았다. 저 아이콘을 본지는 꽤 오래되었는데... 원래 'Bing' 어쩌고 하는 대화형 서비스가 자리잡고 있던 곳이 아니었었나? 



마이크로소프트의 Copilot이 무엇인지 검색을 해 보니 Bing 채팅이 2023년 12월 1일에 리브랜딩된 것이라고 한다. 이를 클릭하여 창을 열고 ChatGPT가 무엇이냐고 물어 보았다.



흠, 제법인걸. 사실 구글 검색창에 뭔가를 입력하여 관련 웹문서를 찾아내는 방식으로는 내가 궁금해하는 낱말의 정확한 설명을 찾기가 어렵다. 질문을 던지고 이에 대하여 대답하는 대형 언어 모델(LLM, large language model - Copilot의 설명에 의하면 수많은 파라미터를 가진 인공 신경망으로 구성된 언어 모델) 서비스가 전통적인 키워드 검색보다 만족스런 대답을 제공하고 있으며, 구글이나 마이크로소프트에서는 웹브라우저와 OS라는 자신의 제품 영역 내에서 소비자를 더 오랫동안 붙들어 두려고 애를 쓰고 있는 것이다.

Copilot에게 직접 정체를 물어 보았다.

Microsoft Copilot은 기존의 빙 챗 (Bing Chat) AI 챗봇을 기반으로 하는 챗봇, 가상 비서 및 생산성 도구입니다. AI를 사용하여 질문에 답변하고, 이메일 요약하거나 프레젠테이션 초안 작성하는 등 다양한 작업을 수행할 수 있습니다. Microsoft 365 앱에서도 Copilot을 활용할 수 있으며, 비즈니스용과 개인용으로 활용할 수 있습니다.


이런 종류의 인공지능 기반 챗봇 서비스를 이용할 때 주의할 점이 몇 가지 있다. ChatGPT의 경우 2022년까지의 데이터로 학습을 했다는 것, 가끔은 거짓말을 한다는 것 등. 그리고 이들이 만들어 주는 결과물의 저작권에 관해서는 아직 사회적 합의가 이루어진 것 같지 않다. 물론 이들이 데이터를 적정한 대가를 지급하지 않고 무료로(무단으로?) 가져다가 학습하는 것에 대해서도 논란이 많다. 실존 인물에 대한 가짜 뉴스 또는 가짜 이미지는 이미 큰 사회적 문제로 떠오르고 있다.

Copilot에게 그림을 그릴 수 있느냐고 물어 보았다. '멋진 여자 기타리스트를 그려 줘'라고 주문을 하였더니 약간의 시간이 흐른 뒤 다음과 같이 1024 x 1024 픽셀의 이미지를 뚝딱 만들어 내었다.

프렛 포지션 마크의 위치가 정확하지 않다.

피크가 없네? 손가락으로 뜯을 수도 있는 거니까...

질문을 조금 더 구체적으로 바꾸어 보았다. '피크를 쥐고 검정색 깁슨 레스폴 커스텀 스타일의 전기 기타를 연주하는 멋진 흑인 여성 기타리스트의 그림을 그려 줘'라고... 생성된 이미지 중 내가 의도한 것과 가장 가까운 것을 골랐다.

그러나 이런 왼손 손톱으로는 기타를 연주하는 것이 불가능하다. 왼손 손가락의 모습도 부정확하다.

정상적인 기타 연주자의 손톱 모양이 나오도록 몇 차례 질문을 구체적으로 바꾸어서 올려 보았지만 100% 만족할 수준의 이미지는 나오지 않았다. 생성형 AI가 사람의 손을 정확하게 그려내지 못한다는 말을 어디선가 들은 것 같다. 내가 시도하여 그린 기타리스트 이미지 중에서는 엄지손가락의 안쪽에 손톱이 붙어 있는 것도 있었으니 말이다. 다음 요청 사항은 '멋진 한국인 남자 기타리스트'이다.

훌륭한데? 앨범 자켓으로 써도 충분할 수준이다. 왼쪽 뒤에 세워진 악기는 첼로 같은데 줄감개가 5개! 드물지만 5현 첼로도 있다고 한다.


이런 요청을 할 때마다 보이지 않는 곳에서 GPU는 돌고 있을 것이며, 전력도 소모할 것이다. 인터넷 저편으로 날리는 엔터 한 번이라는 행위가 A4 용지 서너 장에 연필로 줄만 죽 긋고 구겨서 버리는 행위와 같은 수준으로 자원을 소모한다면(실제로 계산을 해 보지는 않았지만), 아마 자제하게 되지 않을지 모르겠다.

그림을 그려주는 DALL E-3은 역시 OpenAI의 생성형 AI 서비스이다. 원래 유료 버전($20/월)인 ChatGPT-4에서 사용 가능한데, 빙 이미지 크리에이터(따라서 지금은 Copilot)에서 사용 가능한 것이다. 약간의 기능 제한은 있는 것으로 알고 있다. 이는 Copilot이 ChatGPT보다 편리한 점이라고 할 수 있다. 경험적으로 찾은 장점이 하나 더 있다. Copilot은 검색을 통해서 최신 정보를 찾아주는 것까지 겸한다는 것이다. 예를 들어 Copilot에게 보스톤의 현재 기온을 섭씨로 알려달라고 물으면 충실하게 답변을 제공한다. 그러나 다음과 같이 ChatGPT(3.5)는 그렇지 못하다.

Sure! To find out today's weather in New York City in Celsius, you can check a reliable weather website or app. As of now, I don't have real-time access to current weather data. You might want to try checking websites like Weather.com, AccuWeather, or the National Weather Service for the most accurate and up-to-date information.

앞으로 '인간의 힘으로 공들여' 만든 파워포인트 프레젠테이션은 이렇게 AI가 만든 논리정연한 내용과 화려한 그림에 밀려나지 않을까 걱정이 된다.

  • 아직도 스마트폰/스마트워치를 안 쓰세요?
  • 아직도 카카오톡을 안 쓰신다구요?
  • 아직도 종이 통장을 쓰세요?
  • 아직도 파워포인트에서 도형을 그리세요?
  • 아직도 손으로 글씨를 쓰세요?
  • 아직도 손으로 타이핑을 하신다구요?
  • 아직도 AI 서비스 구독을 안 하신다구요?
  • ...
  • 아직도 직접 요리를 하세요?

이러다가 '아직도 직접 숨을 쉬세요?'라고 묻는 시대가 오지 않을지 걱정이 된다. 미처 깨닫지도 못한 사이에 미래는 이미 우리 주변에 와 있다. 그저 재미있고 신기하다고만 생각했던 기술을 이제 적절히 활용하지 못하면 도태되는 시기가 되어 버렸다. 그래서 새로운 기술이나 눈 앞의 이득에 대해서는 늘 철학적 고민이나 판단이 필요하다.

2024년 4월 18일 목요일

연습실 또는 노래방 만들기

하나 둘 사서 모은 음향장비를 차에 싣고 출근하여 내가 근무하는 건물 지하 1층에 설치하였다. 가장 마지막에 구입한 것은 오늘 아침 배송된 카날스의 T자형 마이크 스탠드. 따져보니 두 종류의 스탠드(마이크와 스피커)를 제외하면 대부분 중고품을 구입한 것이다.


블루투스 수신기를 믹서에 연결해 놓았기에 누구든 휴대폰을 연결하여 음악을 재생할 수 있도록 만들었다. 마이크만 잡으면 바로 노래방이 된다. 누구든 사용할 수 있다는 안내문을 붙여 놓았다. 같이 인쇄해 놓은 QR 코드를 찍으면 별도의 위키 문서로 작성한 상세한 기기 사용법(링크)으로 연결된다. 점심 시간을 이용하여 찾아온 동료들과 잠시 즐거운 시간을 가졌다.

문어발처럼 케이블이 복잡하게 연결된 믹서를 일반인이 접할 일은 별로 없다. 나도 익숙해 지는 데에는 많은 시간이 걸린 것을 잘 알기에, 되도록 간단하게 사용법을 기술하려고 노력하였다. 아날로그 믹서 + 파워앰프의 조합보다 더 단순한 장비가 많다. 휴대용 앰프가 그렇고, 오디오 인터페이스 역시 그렇다. 하지만 내가 사용하는 이런 고전적인 장비를 통해 정말 배우는 것이 많다.

욕심을 부리자면 지금 보유한 장비에 대해서 아쉬운 점도 많다. 특히 믹서의 경우 채널이 더 많았으면 좋겠고, balanced output을 지원했으면 좋겠고(파워앰프에서 balanced input을 지원하므로), PFL(pre-fader listen) 버튼이나 이펙터가 내장되어 있으면 좋겠고... 그런 믹서는 아마 Behringer의 10채널 미만 믹서에는 없을 것이다. 어차피 내가 쓰는 장비는 아마추어를 위한 것이니 이 정도 수준에서 만족하도록 하자.

5월 중순에 간단한 공연을 하기로 했다. 주말에는 선정된 곡을 분석하고 개인 연습을 좀 해야 되겠다. 악기는 2-3인이 연주하고 나머지는 backing track으로 채우는 방식의 공연을 생각하고 있다. 유튜브에서 공연할 곡을 찾아서 녹음한 다음 각 악기별로 분리하는 작업을 시도해 보는 중인데, 의외로 AI 기반의 무료 서비스가 놀라운 수준의 결과물을 제공해 주고 있다. 내가 요즘 집중적으로 사용하는 것은 국내에서 개발한 GAUDIO STUDIO라는 것이다. 처리 품질도 매우 만족스럽고, 다른 사람에게 결과물을 공유할 수 있는 링크도 제공한다. 웹 인터페이스에서 각 악기 기준으로 솔로 및 뮤트를 설정하여 재생도 할 수 있다.

Gaudio Studio가 음악을 처리한 뒤의 화면. 그 자체가 플레이어이다.


이런 작업을 최근 며칠 동안 하면서 스템이라는 새로운 개념도 알게 되었다. DAW에서 말하는 트랙과 유사하지만 유사한 악기 단위로 묶었다고 이해하면 좋을 것이다. 스템은 이러한 방식으로 제공되는 음악 파일의 포맷이기도 하다. Native Instruments의 설명(링크)에 의하면 다음과 같다. 이를 다루기 위한 전용 컨트롤러도 존재하는 모양이다.

A Stem file is an open, multi-channel audio file that contains a track split into four musical elements – bass, drums, vocals, and melody for example. With each element available independently, you can mix in ways that just weren’t possible until now.

참 놀라운 세상이다. 음악을 만들기에 정말 부족함이 없을 정도로 기술이 발달하였다. 그만큼 창작은 더 쉬워진 것일까, 혹은 어려워진 것일까?

2024년 4월 12일 금요일

4·10 총선 이후 - 다시 안보(安保, security)를 생각하다

22대 총선이 끝나고 개표도 완결되었다. 새삼스러울 것도 없지만, 출구조사 결과가 실제 결과와 매우 다르다는 것은 별로 바람직하지 못하다. 사전투표에 대해서는 조사를 금지하기 때문에 차이가 난 것이라면 그건 수긍할 수 있다. 그러나 투표소를 나서면서 조사원에게는 일부러 자신이 기표한 결과에 대해 거짓말을 한 것이라면, 왜 그렇게 행동하는 것일까? 아마도 출구조사를 바탕으로 예측한 결과가 실제로 뒤집어졌을 때 통쾌함을 느끼는 사람이 많다는 뜻으로 해석해도 될 것이다. 만약 이것이 사실이라면, 그 사회는 대단히 건전하지 못하다는 것이 나의 생각이다.

아침 출근길에는 교차로에 서서 당선 인사를 올리는 특정 당 사람들의 모습이 보였다. 국내 정치는 앞으로 또 어떻게 바뀔까? 그 결과는 바람직한 곳으로 흘러가게 될까? 관심을 갖고 지켜 볼 일이다.

우리가 어찌할 수 없는 국외 상황은 더욱 불투명하다. 장벽을 느끼지 않을 정도로 서로 자유롭게 교역(물자와 정보를 전부 포함)을 하는 세상은 상상 속에서나 가능한 일인지도 모르겠다.

바이오안보 이슈와 관련해서 보다 더 자세하게 공부하고 싶다면 국가안보전략연구원(미 생물보안법(Biosecure Act))과 한국바이오협회(민감정보 해외이전 규제)에서 상세한 분석 자료를 공개하였으니 이를 참고하는 것이 좋을 것이다.

납땜질이나 하고 공연용 스피커를 구입하겠다고 그렇게 검색을 해 대면서도 정작 바깥 세상이 돌아가는 일에는 너무 관심을 갖지 않고 있었다. 적절한 세계관과 철학을 지닐 나이가 이미 한참 지났음에도 불구하고, 아직 내가 세상을 바라보는 시각은 매우 순진한 것 같다. '안보'는 한물 간 이슈라고 생각하고 있었는데 전혀 그렇지 못하다.

실질적인 위협이 될 가능성은 매우 적지만, 항상 '적'이 있다고 믿는 것(혹은 믿게 만드는 것)이 모두에게 도움이 되는 일일지도? 촌충을 일부러 자기 장 속에서 3년 동안 기르면서 더 좋은 건강 상태를 유지했다는 일본 과학자의 유명한 이야기도 있다. 이것은 믿음이 아니라 실제의 문제였다.  

얼마든지 길게 쓸 수 있는 무거운 주제이나, 오늘은 논문을 하나 소개하는 것으로 끝을 맺겠다. 

시큐리티(security)는 어떻게 '안보'가 되었을까? '안전', '안전보장', '안보'로의 전환 과정을 중심으로. 국제정치논총  제60집  4호  (2020),  41-77. 원문 링크, doi: 10.14731/kjir.2020.12.60.4.41