Skip to content

기글하드웨어기글하드웨어

인터넷 / 소프트웨어 : 윈도우즈, 리눅스, 기타 운영체제, 각종 어플리케이션, 프로그램, 소프트웨어, 인터넷, 인터넷 서비스에 대한 이야기, 소식, 테스트, 정보를 올리는 게시판입니다. 2016년 7월 이전의 글은 다음 링크를 참조하세요. 구 소프트웨어 뉴스 / 구 소프트웨어 포럼 / 구 뉴스 리포트 / 구 특집과 정보 / 구 스페셜 게시판 바로가기

profile
조회 수 4197 댓글 14
Extra Form

waifu2x를 통해 2d 이미지를 퀄리티 좋게 확대하는것이 가능해졌습니다. 그리고 waifu2x-caffe를 사용하면 cuda나 cudnn 가속을 사용할 수 있고요.. 예전에 이 방법을 통해서 리듬게임 bga 영상을 고화질으로 몇번 만들어 봤었는데 간단하게 방법을 소개해 보도록 하겠습니다.

 

작업순서는 다음과 같습니다.

 

1. ffmpeg로 동영상을 이미지 시퀀스화

2. 이미지 시퀀스화된 이미지를 waifu2x-caffe로 확대

3. 확대된 이미지를 ffmpeg로 연결(+인코딩) [+ 소리와 합침]

 

*반드시 64bit OS가 필요하며(waifu2x-caffe가 32bit OS를 미지원 함), 영상은 프레임 수가 엄청나게 많으므로 cuda(cudnn) 가속을 사용하는 것이 좋습니다.

 

필요한 프로그램은 waifu2x-caffe, ffmpeg 입니다.

 

waifu2x-caffe https://github.com/lltcggie/waifu2x-caffe/releases

 

ffmpeg windows 빌드

 

*8비트 인코딩 (64bit static을 받아서 압축해제) https://ffmpeg.zeranoe.com/builds/

 

*10비트 인코딩용 빌드 (가장 최근 날짜 폴더의 파일명이 static 64bit high bit depth로 된 zip를 받음) https://sourceforge.net/projects/ffmpegwindowsbi/files/?source=navbar

 

우선 영상을 선정합니다. 영상은 되도록 640x360 이상인게 좋으며, 거의 어지간해서는 크기 2배를 할 때가 가장 보기가 좋습니다. 그리고 크기를 2배 이상으로 설정할 경우 2배 확대했던 이미지를 다시 그대로 2배 확대하는 방식으로 이미지가 만들어 집니다.

 

그리고 영상의 종류는 실사, 3d 폴리곤 형태인 경우 정말 하나마나이므로 추천하지 않습니다. waifu2x-caffe의 특성 상 애니메이션 계열이 가장 효과가 좋습니다.

 

1. ffmpeg로 동영상을 이미지 시퀀스화

 

2016-08-20 (10).png

 

우선 ffmpeg를 압축 해제 하시면 ff-prompt.bat 파일이 있습니다. 실행하면 검은 cmd 창이 하나 나오는데, 명령어를 다음과 같이 입력합니다.

 

ffmpeg -i 원본영상.확장자 -q:v 0 대상폴더\images%05d.jpg

 

예시 : 파일이름이 name.mp4인 영상을 D:\upscale에 저장

 

ffmpeg -i name.mp4 -q:v 0 D:\upscale%05d.jpg

 

*저장할때 손실 포맷인 jpg를 사용하는 이유는 거의 대부분의 영상이 yuv포맷(4:2:0)으로 저장되어 있기 때문입니다. png는 yuv포맷으로 저장이 불가능하여 rgb로 이미지가 저장되는데, 저장시에 yuv→rgb로 변환이 되면서 화질 손실이 발생합니다.

 

그리고 위와 같이 변환 후 보여지는 창에 Stream #0.0 video로 시작하는 문구가 있습니다.

 

Stream #0:0: Video: h264 (High 10), yuv420p10le, 1920x1080 [SAR 1:1 DAR 16:9], 23.98 fps, 23.98 tbr, 1k tbn, 47.95 tbc (default)

 

그중에 fps를 잘 메모해 놓으시면 됩니다.

 

2016-08-16 (10).png

 

변환된 이미지 목록을 확인하면 이런 식으로 나오게 됩니다.

 

2. 이미지 시퀀스화된 이미지를 waifu2x-caffe로 확대

 

2016-08-20 (9).png

 

그리고 변환한 이미지를 waifu2x-caffe로 돌립니다. 여기서도 jpg로 설정 후 출력 화질은 100 으로 설정합니다. 만일 영상이 bd 미디어 등에서 립을 뜬 파일인 경우 노이즈 제거 단계를 1단계나 0단계로 설정 하시는게 좋습니다.

 

노이즈 제거 단계를 높이게 되면 애니메이션의 경우 셀화의 디테일한 부분이 사라질 가능성이 높으며 뭔가 뭉개진듯한 느낌을 받을 수 있습니다.

 

확대 비율은 2로 설정합니다.

 

모델의 경우 UpRGB와 UpPhoto 이 둘중에 하나만 쓰면 되는데, 저는 설명에 적혀있는 데로 영상을 변환하는 것이므로 UpPhoto 모델을 사용합니다. 이 역시 뭔가 디테일한 면이 사라진다고 해야되나..

 

TTA 모드는 속도가 8분의 1으로 줄어들으므로 체크 안하시는것을 추천합니다. 화질이 조금 더 개선되는 효과가 있다고는 하는데 너무 오래 걸려서...

 

분할 크기는 칸에 입력도 가능합니다. pc와 이미지에 따라 팅기지 않는 최적의 수치를 찾아서 설정 후 돌리시는것을 추천합니다. 크기를 크게 할 수록 VRAM을 많이 사용하게 됩니다.

 

*추가 : 나중에 안 사실이지만... 분할 크기를 무작정 크게 늘린다고 빨라지지는 않습니다. 이미지의 크기에 따른 최적의 크기를 먼저 찾은 후에 돌리시는 것을 추천합니다. 세로프레임 길이의 2분의 1을 하는게 가장 나은듯 하네요.

 

3. 확대된 이미지를 ffmpeg로 연결(+인코딩) [+ 소리와 합침]

 

사실 이 부분은 인코딩을 어떻게 할 것인가에 따라 속도가 천차만별으로 변합니다. 그러나 여기에서는 프리셋과 인코딩 하는 방법의 설명은 생략하며, 기본적인 이미지 +소리 → 동영상 에 대해서만 설명 하겠습니다.

 

이전에 실행했던 ffprompt.bat를 실행합니다.

 

*기본적인 x264를 사용하는 명령어입니다.

 

ffmpeg -framerate 23.98 -i images%05d.jpg -i 원본영상파일명.확장자 -c:v libx264 -preset slow -crf 19 -pix_fmt yuv420p -c:a copy 저장할파일.확장자

 

-framerate 23.98 : 위에서 메모해야 했던 fps 입니다. fps가 일치하지 않으면 영상 싱크가 맞지 않으니 반드시 확인 후 인코딩을 실행하세요.

 

원본영상파일.확장자 : 원본 영상의 소리를 가져오기 위해서 추가합니다. 뒤에 -c:a copy (오디오 트랙 복사)와 맞물려 있습니다. 저장할때 사운드 코덱 변경도 가능하지만 여기에서는 생략합니다.

 

crf 19 : 0에 가까울수록 화질이 좋아지며 용량이 커집니다. 보통 화질의 기준은 24이며 0-51으로 설정이 가능합니다. 22~23만 되어도 충분히 좋은 화질이 나옵니다. (저는 19를 사용함) 16~24 사이에서 설정을 추천 합니다.

 

x265 인코딩을 하려면 -c:v를 libx265로 설정 하면 됩니다.

 

x265 10bpp 인코딩 시에는 위에서 10비트용 ffmpeg를 받아 실행해야 하며, -c:v를 libx265로, -pix_fmt를 yuv420p10le로 바꾸면 됩니다. 10비트 cpu 인코딩은 속도가 매우 느리므로 참고 바랍니다.

 

만일 nvenc를 사용하여 gpu 인코딩을 하고싶은 경우, -c:v 부분을 nvenc_h264 또는 nvenc_hevc 를 사용 하시면 됩니다.

*nvenc를 사용하면 -crf 수치를 적용할 수 없어 -crf를 지우고 -b:v 비트레이트(50M, 50000K 등)를 입력해야 합니다. 또한 같은 비트레이트일 경우 cpu로 하는 인코딩에 비해서 화질이 약간 떨어지는 경향이 있으므로 비트레이트 자체를 높게 주는것이 좋습니다.

 

*파스칼은 hevc main10 하드웨어 인코딩이 가능한데, 직접 해보지 못해서 어떤 명령어를 써야하는지 잘 모르겠네요..;

 

퀵싱크를 이용해서 인코딩을 할 경우에는 -c:v 부분을 h264_qsv 나 hevc_qsv로 하면 될것 같습니다. 이부분도 역시 직접 해보지 못한거라 잘 모르겠습니다.

 

그외의 특정 애니릴 같은 경우는 캡션이나 mkv 내장자막 같은 항목들이 있는데, megui에 내장된 툴을 사용하면 쉽게 가져올 수 있으며 이부분의 설명 역시 생략합니다.

 

2016-08-20 (4).png

 

이렇게 까지만 하면 끝입니다.

 

그나저나.. 명령어를 ffmpeg 내에서 알아낼려고 help를 몇번 쳐 봤는데 도움이 전혀 되지 않아서 검색 하느라 조금 오래 걸렸네요... 특히 파스칼 main10 인코딩은 검색 아무리 해도 나오지가 않아서.. 아직 1060이 없어서 해볼 수도 없고..



  • profile
    title: 이과arc4411      2018/4/9 ~ 2020/1/9 이병 45 메인컴 : R5 1600 16GB GTX1060 3GB 서브컴 : E3-1270 V2 8GB GTX1050 2GB 서드컴 : z8300 2GB 2016.08.21 00:28
    누가 ffmpeg에 gui좀 씌워줬으면 좋겠어요 진짜로
  • profile
    케닌      모질라 불여우 2016.08.21 00:31
    커맨드를 알아야지만 쓸 수 있어서 너무 불편해요..ㅜㅜ
  • ?
    퀘윈 2016.08.21 08:09
    오토잇으로 대충 만들어도 편할 것 같아요.

    만들어 볼까나...
  • profile
    Φloteer      Now Playing: インドア系ならトラックメイカ.mp3 2016.08.21 15:50
    그 ffmpeg에 gui 프론트엔드를 씌운 게 흔히 "xx인코더" 등의 이름으로 돌아다니는 gui기반 인코더들이지 말입니다.. 까보면 전부 ffmpeg에 껍데기 씌운 구성.
    문제는 그 대부분이 ffmpeg의 기능의 일부분만을 지원한다는 건데.. 아무래도 대부분 초보자대상이다 보니까요.
  • profile
    케닌      모질라 불여우 2016.08.21 15:51
    네 그렇죠.. 기능이 전부 생략되어 있거나 옵션 같은것도 죄다 간략화 한 형태.. 차라리 공식에서 gui를 썼으면 좀 나았을것 같은...
  • profile
    쮸쀼쮸쀼 2016.08.21 02:21
    -crf 값이 기본값이 23으로 알고 있는데, 19면 좀 높은 편이거든요. 높은 값을 추천하는 이유가 있으신가요?
  • profile
    케닌      모질라 불여우 2016.08.21 11:16
    사실 별 이유가 있는건 아닌데.. waifu2x로 노이즈도 빼고 새로 그렸으니 높게 주는게 낫지 않을까? 해서 높게 준것입니다.
  • profile
    쮸쀼쮸쀼 2016.08.21 13:14
    그냥 22~23 정도만 되어도 충분히 깨끗합니다. 차라리 -preset을 slow로 바꾸는 게 더 나을 것 같습니다.
  • profile
    케닌      모질라 불여우 2016.08.21 13:16
    음.. 근데 저는 22~23 정도로 하면 화질이 약간 아쉬워서 그냥 19를 사용하네요. 우선 본문 내용은 고쳐놓겠습니다.
    프리셋 부분도 같이 고쳤습니다.
  • ?
    호호 2016.08.21 07:47
    와우 유용한 글 잘 보고 갑니다
  • profile
    title: 고삼다니엘_      하와와...카푸치노 말곤 커피는 마실줄 모르는거에오/아즈냥냥 2016.08.21 11:05
    알아두면 쓸일이 있을거 같은 팁이군요
  • profile
    VoxPopuli 2016.08.21 15:36
    오호. Split size는 직접 타이핑이 가능했군요.

    512도 VRAM을 2G 정도밖에 안 쓰기에 1024를 넣었더니 되는 파일이 있고 안 되는 파일이 있네요.

    1024로 돌린다고 8G를 다 먹진 않을 텐데..
  • profile
    케닌      모질라 불여우 2016.08.21 15:48
    뭔가 넣은 파일의 이미지 크기와 관련이 있는게 아닐까 싶네요.
  • profile
    플로넨      ^_^ 2016.08.21 21:25
    순간적으로 사용량이 많아지는 구간이 있는데 그 때의 사용량 기준으로 책정되는 것 같습니다.
    512 640은 되는데 768, 896, 960, 1024에서는 문제가 생겨요.

작성된지 4주일이 지난 글에는 새 코멘트를 달 수 없습니다.


  1. 다음지도가 카카오맵으로 바뀝니다

    지도 좀 볼려고 열었다가 뜬 창입니다. 앱 이야기만 하는거 보니 웹 서비스는 그대로 다음 지도를 유지하는듯. 모바일에서야 브랜드를 카카오로 합치는 게 시너지 효과가 있을테니 나쁜 선택은 아닌 것 같지만. 처음부터 우회상장 이야기...
    Date2016.08.31 소식, 참고 By낄낄 Reply12 Views1228 file
    Read More
  2. 도트 이미지의 화질을 높여주는 프로그램

    David Garcia가 개발한 srez라는 프로그램입니다. 16x16해상도의 이미지를 64x64로 늘려주는데, 딥 러닝을 통해 얻은 패턴으로 고화질로 만들어준다고 합니다. 아래 사진은 첫번째가 16x16, 두번째가 일반적인 바이큐빅으로 확대한 것, 세...
    Date2016.08.31 소식, 참고 By낄낄 Reply32 Views22311 file
    Read More
  3. No Image

    지난 인터파크 해킹 발단은 특정 직원 겨냥한 '작살형 피싱'이라고 합니다.

    기사링크http://news.naver.com/main/read.nhn?mode=LPOD&mid=sec&oid=001&aid=0008652468&isYeonhapFlash=Y   인터파크 내부의 특정 직원 타겟으로 삼아 해당 직원의 동생을 사칭하여 악성코드가 내포된 이메일을 보냈다...
    Date2016.08.31 소식, 참고 Bytitle: 귀요미그래핀 Reply2 Views776
    Read More
  4. No Image

    오페라, 비밀번호 강제 재설정

    오페라는 오페라 싱크의 동기화 시스템에 해커가 칩입한 것을 발견하고, 오페라 브라우저의 접속 비밀번호를 일괄적으로 강제 재설정하기로 방침을 정했습니다. 해킹의 영향을 받은 건 오페라 싱크 사용자 뿐이고 오페라 브라우저만 사용...
    Date2016.08.30 소식, 참고 By낄낄 Reply1 Views319
    Read More
  5. 윈도우 10 hidpi 스케일링 질문...

      와사비망고 zen u400 uhd tv를 지포스 1060이랑 연결해서 쓰느라 모니터의 dpi를 200%로 사용하는데, 레거시 앱들은 프로그램에서 보여지는 픽셀 1개가 모니터에서는 픽셀 2개로 처리되어서 (스케일링 되어서) 표시가 됩니다. 그런데 ...
    Date2016.08.29 질문, 토론 By케닌 Reply0 Views634 file
    Read More
  6. No Image

    시놀로지 외부 접속은 FTP보다 WebDAV가 낫네요

    본가에서 자취방의 해놀로지에서 FTP로 비트레이트가 3만 kbps인 블루레이를 하나 땡겨보려고 FTP를 열었습니다. 하지만 파일을 땡겨오니 스트리밍이 원활치 않고 대역폭도 5MB/s에서 더 늘지 않더군요.   혹시나 해서 WebDAV를 열고 그쪽...
    Date2016.08.28 일반, 잡담 ByCentrair Reply2 Views2469
    Read More
  7. No Image

    윈도우 10 레드스톤, 무선 USB 네이티브 지원

    윈도우 10 레드스톤 2 인사이더 빌드에 MA-USB 드라이버가 포함됐다고 합니다. MA-USB는 Media Agnostic USB의 줄임말로 USB-IF의 새로운 표준입니다. USB 기반으로 기가비트 무선 전송을 실현하는데 USB 3.1, 3.0, 2.0 스펙을 준수합니다...
    Date2016.08.26 소식, 참고 By낄낄 Reply4 Views848
    Read More
  8. No Image

    엑셀기능질문입니다

    엑셀의 시트명을 불러와서 그걸 다시 함수로 쓰고 싶은데 어떻게 할까요?.       각 시트명은 1,2,3,4,5,6,7,8,9,10이고 1시트의 a1셀은 10이고 1제외한 시트의 a1셀은 '시트명 -1'의 a1셀입니다   제일쉬운건 일일이 노가다로 2시트에다...
    Date2016.08.24 질문, 토론 By주기율표 Reply2 Views286
    Read More
  9. 패러럴즈 데스크탑 12 맥 버전

    패러럴즈 데스크탑 12 맥 버전이 일본에서 출시됐습니다. 가격은 8500엔. 맥에서 윈도우를 비롯한 다른 운영체제를 실행하는 가상화 소프트웨어입니다. 맥OS 시에라 지원, 성능 향상과 최적화가 주요 특징. 백업은 어크로니스 트루 이미지...
    Date2016.08.23 소식, 참고 By낄낄 Reply0 Views680 file
    Read More
  10. 윈도우 10의 새 버그. 킨들을 연결하면 블루스크린

    윈도우 10 애니버서리 업데이트에 또 다른 버그가 존재합니다. 킨들을 연결하면 블루스크린이 뜬다네요. 정확히 어떤 문제인지 알 수 없으나, 다시 연결하면 정상이라고 합니다. 그리고 10586 버전에선 이런 일이 생기지 않는다네요.
    Date2016.08.22 소식, 참고 By낄낄 Reply1 Views739 file
    Read More
  11. 리눅스 커널 4.7.2 발표

    리눅스 커널 4.7.2가 나왔습니다. 이번에는 성능에 관련된 여러 조정이 있었는데, ARM64, ARM, ARC, MIPS, s390, X86, PowerPC 아키텍처의 지원과 드라이버 업데이트가 추가됐습니다. 그리고 Greg에서 AMD GPU의 지원을 개선했습니다.
    Date2016.08.22 소식, 참고 By낄낄 Reply0 Views639 file
    Read More
  12. 자바스크립트는 루프지연이 참 어렵군요

    다른 비동기 프로그래밍 언어도 그런건지는 잘 모르겠으나 이게 루프 돌릴때 참 골때립니다. 해보신분은 알겠지만 자바스크립트에서 지연처리를 한다고 하면 setTimeout이나 setInterval을 쓰죠   setTimeout(fn, delay)   이렇게 쓰면 함...
    Date2016.08.22 일반, 잡담 ByWebGL Reply2 Views1612 file
    Read More
  13. No Image

    윈도우 10의 USB 캠 영상 포맷 문제

    윈도우 10 애니버서리 업데이트에선 USB 캠의 스트리밍 방식을 바꿨습니다. 윈도우 10은 더 이상 MJPEG와 H.264 포맷으로 영상을 전송하지 않으며, 소프트웨어에서 압축하지 않은 YUV와 NV12 포맷을 쓰길 요구한다네요. 만약 USB 캠코더가...
    Date2016.08.21 소식, 참고 By낄낄 Reply2 Views694
    Read More
  14. ffmpeg와 waifu2x-caffe를 사용하여 영상을 확대하기

    waifu2x를 통해 2d 이미지를 퀄리티 좋게 확대하는것이 가능해졌습니다. 그리고 waifu2x-caffe를 사용하면 cuda나 cudnn 가속을 사용할 수 있고요.. 예전에 이 방법을 통해서 리듬게임 bga 영상을 고화질으로 몇번 만들어 봤었는데 간단하...
    Date2016.08.21 분석, 팁 By케닌 Reply14 Views4197 file
    Read More
  15. 기적의 수학자 유튜브

    언젠가 제가 유튜브의 음질이 개판이라던가 60fps로 가면 비트레이트가 오히려 떨어진다던가 하는 이야기를 들어봤었는데 문득 동영상 업로드 하고 나서 그게 다시 떠오르더군요.   그래서 한번 영상을 유튜브에서 다시 받아서 등록 정보...
    Date2016.08.20 일반, 잡담 Bytitle: 이과arc4411 Reply1 Views1065 file
    Read More
목록
Board Pagination Prev 1 ... 92 93 94 95 96 97 98 99 100 101 ... 106 Next
/ 106

최근 코멘트 30개
델몬트
05:28
PLAYER001
05:14
int20h
04:25
int20h
03:41
노루
03:28
노루
03:16
아카츠키
02:48
까마귀
02:45
rnlcksk
02:32
AcidGhost
02:29
슈크림
02:27
스파르타
02:03
스파르타
02:03
스파르타
02:02
스파르타
02:02
슬렌네터
01:53
아카츠키
01:49
스파르타
01:47
부천맨
01:43
ASTRAY
01:43
낄낄
01:37
부천맨
01:26
부천맨
01:24
포인트 팡팡!
01:23
벨드록
01:23
부천맨
01:22
idiot
01:20
부천맨
01:17
부천맨
01:16
아란제비아
01:16

MSI 코리아
와사비망고
쓰리알시스템

공지사항        사이트 약관        개인정보취급방침       신고와 건의


기글하드웨어는 2006년 6월 28일에 개설된 컴퓨터, 하드웨어, 모바일, 스마트폰, 게임, 소프트웨어, 디지털 카메라 관련 뉴스와 정보, 사용기를 공유하는 커뮤니티 사이트입니다.
개인 정보 보호, 개인 및 단체의 권리 침해, 사이트 운영, 관리, 제휴와 광고 관련 문의는 이메일로 보내주세요. 관리자 이메일

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소