게임 영상을 Uncompressed RAW 8비트로 녹화해서 프리미어 프로에서 12비트 JPEG2000으로 출력한 다음 H.264 High 4:4:4 Intra 10비트로 인코딩을 주로 합니다. 이렇게해서 최대 128GB까지 지원하는 유튜브에 업로드합니다. 인코딩 환경은 코어i7-3635QM, 라데온 HD8870M 2GB GDDR5, 12GB DDR3 RAM, 삼성 850 PRO 512GB입니다.

ffmpeg 8비트 버전은 4:2:0 색상만 지원하는 High10 프로파일의 10비트 인코딩만 가능했지만 ffmpeg 10비트 버전에서는 x264 High 4:2:2 프로파일 10비트와 High 4:4:4 Predictive 10비트 인코딩도 가능합니다. 하지만 10비트에서는 절대로 OpenCL GPU 가속을 못씁니다. 40분짜리 영상 인코딩하는데에 무려 10시간이 걸립니다. 그 전에 프리미어 프로에서 6시간 걸려서 출력한 것도 생각하면... GPU 연산 코어 (퀵싱크, NVENC같은 하드웨어 회로가 아닌)를 쓰지않고서는 인코딩이 시간이 오래걸리네요.

x264나 x265도 싹 갈아엎어서 GPU와 CPU 간의 이종병렬 연산으로 속도가 개선되면 좋겠네요.

ffmpeg -i "[입력 파일]" -threads 0 -map_metadata -1 -acodec flac -codec:v libx264 -r 48000/1001 -vf scale=2048:1152 -pix_fmt yuv444p10le -profile:v high444 -intra -x264opts nal-hrd=cbr:bitrate=360000:vbv-maxrate=360000:vbv-bufsize=360000:vbv-init=1:qcomp=0:ratetol=0:rc-lookahead=0:sync-lookahead=0:bluray-compat=1:constrained-intra=1:cabac=1:qpmin=0:qpmax=81:qpstep=1:direct=spatial:8x8dct=1:partitions=ipcm,i16x16,i16x8,i16x4,i8x8,i8x4,i4x4:scenecut=1:deblock=-3,-3:aq-mode=3:aq-strength=1:me=tesa:me-range=64:subme=9:psy-rd=1.00,0.00:no-mbtree:force-cfr:no-dct-decimate:no-fast-pskip:no-mixed-refs:non-deterministic:chroma-me:trellis=0:cqm=jvt:psnr:ssim:colorprim=bt2020:transfer=bt2020-12:colormatrix=bt2020nc:opencl "[출력 파일]"

video:108987053kB audio:509702kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.005584%
[libx264 @ 000001dad833bd80] frame I:118924 Avg QP:20.81  size:938438  PSNR Mean Y:48.85 U:48.34 V:48.71 Avg:48.59 Global:45.76
[libx264 @ 000001dad833bd80] mb I  I16..4:  7.6% 69.6% 22.8%
[libx264 @ 000001dad833bd80] 8x8 transform intra:69.6%
[libx264 @ 000001dad833bd80] coded y,u,v intra: 98.4% 96.6% 93.2%
[libx264 @ 000001dad833bd80] i16 v,h,dc,p: 12% 12% 48% 28%
[libx264 @ 000001dad833bd80] i8 v,h,dc,ddl,ddr,vr,hd,vl,hu:  8% 17% 10%  9% 11%  9% 13%  9% 14%
[libx264 @ 000001dad833bd80] i4 v,h,dc,ddl,ddr,vr,hd,vl,hu:  8% 14%  4%  9% 14% 10% 15%  9% 15%
[libx264 @ 000001dad833bd80] SSIM Mean Y:0.9947609 (22.807db)
[libx264 @ 000001dad833bd80] PSNR Mean Y:48.853 U:48.340 V:48.713 Avg:48.594 Global:45.756 kb/s:360000.00

인코딩 파일의 정보입니다. high 프로파일 (4:2:0 8비트)에서는 DXVA 가속이 잘만 되던 팟플레이어가 High 4:4:4 10비트로 인코딩된 파일 앞에서는 CPU 빨로 돌아가면서 엄청나게 버벅이더군요.

General
Format                         : Matroska
Format version                 : Version 4 / Version 2
File size                      : 104 GiB
Duration                       : 41mn 20s
Overall bit rate mode          : Variable
Overall bit rate               : 362 Mbps
Writing application            : Lavf57.11.100
Writing library                : Lavf57.11.100 / Lavf57.11.100

Video
ID                             : 1
Format                         : AVC
Format/Info                    : Advanced Video Codec
Format profile                 : High 4:4:4 Predictive Intra@L5
Format settings, CABAC         : Yes
Format settings, GOP           : N=1
Codec ID                       : V_MPEG4/ISO/AVC
Duration                       : 41mn 20s
Bit rate mode                  : Constant
Nominal bit rate               : 360 Mbps / 360 Mbps
Width                          : 2 048 pixels
Height                         : 1 152 pixels
Display aspect ratio           : 16:9
Frame rate mode                : Constant
Frame rate                     : 47.952 (48000/1001) fps
Color space                    : YUV
Chroma subsampling             : 4:4:4
Bit depth                      : 10 bits
Scan type                      : Progressive
Bits/(Pixel*Frame)             : 3.182
Writing library                : x264 core 148 r2638 7599210
Encoding settings              : cabac=1 / ref=1 / deblock=1:-3:-3 / analyse=0x3:0x3 / me=tesa / subme=9 / psy=1 / psy_rd=1.00:0.00 / mixed_ref=0 / me_range=64 / chroma_me=1 / trellis=0 / 8x8dct=1 / cqm=1 / deadzone=21,11 / fast_pskip=0 / chroma_qp_offset=4 / threads=12 / lookahead_threads=1 / sliced_threads=0 / nr=0 / decimate=0 / interlaced=0 / bluray_compat=1 / constrained_intra=1 / bframes=0 / weightp=0 / keyint=1 / keyint_min=1 / scenecut=1 / intra_refresh=0 / rc_lookahead=0 / rc=cbr / mbtree=0 / bitrate=360000 / ratetol=0.0 / qcomp=0.00 / qpmin=1 / qpmax=81 / qpstep=2 / vbv_maxrate=360000 / vbv_bufsize=360000 / nal_hrd=cbr / filler=1 / ip_ratio=1.40 / aq=3:1.00
Default                        : Yes
Forced                         : No
Color range                    : Limited
Color primaries                : BT.2020
Transfer characteristics       : BT.2020
Matrix coefficients            : BT.2020 non-constant
DURATION                       : 00:41:20.061000000

Audio
ID                             : 2
Format                         : FLAC
Format/Info                    : Free Lossless Audio Codec
Codec ID                       : A_FLAC
Duration                       : 41mn 20s
Bit rate mode                  : Variable
Channel(s)                     : 2 channels
Channel positions              : Front: L R
Sampling rate                  : 48.0 KHz
Bit depth                      : 24 bits
Writing library                : Lavc57.10.100 flac
Default                        : Yes
Forced                         : No
DURATION                       : 00:41:20.040000000