졸업 프로젝트5 음성, 파일명 등 변환에 유용했던 리눅스 명령어 #audio sample rate 한꺼번에 바꾸기. 새로운 파일이 생성된다는 단점(예시는 16000) find ./ -name "*wav" -exec sox {} -r 24000 -b 16 -c 1 {}.24000.wav \; #스펙에 맞게 변환하기 sox input.wav -b 16 -r 16000 -c 1 output.wav #오디오 파일 합치기? sox *.wav output.wav #파일명 한꺼번에 변경 rename test test0 test? #(test?인 애들에서 test를 test0로 대체) #음성 형식 한꺼번에 변경(예시는 m4a to wav) for i in *.m4a; do ffmpeg -i "$i" "${i%.*}.wav"; done #특정 문자 포함하는 파일 제외하고 삭제(240.. 2023. 5. 24. 음성 변환 앱의 백엔드&AI 로직 구현기 우리 팀은 사용자의 목소리로 외국어 더빙을 만들 수 있는 앱, voco를 만들었다. 🎈 기본 구조 이를 위해서는 Voice Conversion 모델이 필요했다. (안드로이드 클라이언트 -> 스프링 백엔드 서버) 로 음성 생성 요청을 보내고 (스프링 백엔드 서버 -> 플라스크 AI 서버) 로 모델 구동 요청을 보내면 (플라스크 AI 서버 -> AWS S3) 로 음성을 저장하고 저장된 음성을 클라이언트에서 사용하는 구조가 기본적인 서비스이다. 🎈 모델 선정 여러 모델들을 테스트해본 끝에 StarGANv2라는 모델을 선정하게 되었다. GitHub - yl4579/StarGANv2-VC: StarGANv2-VC: A Diverse, Unsupervised, Non-parallel Framework for Nat.. 2023. 5. 15. 고성능 노트북을 서버로 사용하기 덮개를 닫아도 절전모드로 전환되지 않게 하려고 sudo vim /etc/systemd/logind.conf HandleLidSwitch=ignore sudo systemctl restart systemd-logind CLI에 이걸 입력함. 갑자기 검정 화면에 커서가 깜박거림. Ctrl+Alt+F4를 눌러서 터미널을 열어줌. sudo apt-get install --reinstall ubuntu-desktop 이걸 해줌. Ctrl+Alt+F2 로 gui창으로 돌아감. 로그인을 하려고 했는데 로그인 무한 루프를 도는 문제가 발생. password가 맞아도 무한히 로그인 화면만 뜸. sudo apt update sudo apt-get -y dist-upgrade sudo apt-get -y autoremove.. 2023. 1. 4. Cross lingual voice cloning 삽질기 안녕하세요. 지금부터 cross lingual voice cloning 삽질기를 시작하겠습니다. 먼저 초보자의 시선에서 작성되었기 때문에 잘못된 부분이 많을 수 있다는 점을 참고하고 읽는 것을 권유드립니다. 🔥 Tencent 클라우드 GPU 사용하기 무슨 실습을 하건 제가 가진 GPU 따위는 없기 때문에 학교에서 제공하는 tencent cloud GPU를 사용해야 합니다. 저는 window를 씁니다. 그렇기에 클라우드 gpu를 사용하기 위해서는 putty를 사용해야 합니다. tencent에서 제공하는 CLI는 10초에 한 번씩 연결이 끊기기 때문이죠. putty를 설치합니다. (여기서 https://www.putty.org/ ) putty로 서버에 접속하기 위해서는 ppk generator를 이용해 pe.. 2022. 11. 25. 이전 1 2 다음