当前位置：首页 > news >正文

付费腾讯企业邮箱入口关键词排名优化官网

news 2025/12/20 12:14:47

付费腾讯企业邮箱入口,关键词排名优化官网,品牌网站设计公司哪家好,网站外包要花多少钱本文转载自#xff1a;http://blog.csdn.net/embedesign/archive/2009/09/15/4556486.aspx#xff0c;版权归原作者#xff0c;编辑#xff1a;小乙哥多媒体通信终端设备具有广泛的应用前景#xff0c;可以应用于视频会议、可视电话、PDA、数字电视等各个领域#xff0…本文转载自http://blog.csdn.net/embedesign/archive/2009/09/15/4556486.aspx版权归原作者编辑小乙哥多媒体通信终端设备具有广泛的应用前景可以应用于视频会议、可视电话、PDA、数字电视等各个领域所以高效、实用的多媒体终端设备一直是通信领域研究的主要方向之一。多媒体通信终端的实现主要有两点一方面需要快速、稳定的处理器作为媒体信号处理的平台另一方面需要适合多媒体通信的协议标准和软件算法尤其是对音视频信号的压缩处理算法。两者的结合才能产生高效的多媒全通信设备。目前随着数字信号处理器DSP的高速发展为实现高效的音视频信号处理提供了可能性另一方面最新的低码率视频压缩标准H.264的出台提供了适合通信的视频标准和算法指导。因此将两者结合把H.264算法在DSP上实现对于多媒体通信的研究具有一定的意义和价值。本文介绍了H.264解码器算法的DSP实现。在设计中采用了ATEME公司的网络视频开发平台NVDKC6416作为DSP处理平台实现了H.264的优化解码算法。对于QCIF视频序列解码速度达5060帧/秒。 1 网络视频开发平台NVDK简介 NVDK是TI的第三方ATEME公司推出的基于TIC6400系列DSP评估开发套件是一套适用于图像、视频信号处理的高速DSP开发平台。该套件为诸如视频基础设施及网络化视频设备等高级视频应用制造商提供了方便提高了数字视频应用项目的开发速度。 1.1 NVDK C6416体系结构 NVDK C6416由TMS320C6416 DSP内核、10/100Mbps的以太网子卡、音频/视频接口盒、PCI总线、存储器单元、扩展接口及独立电源等构成。其功能结构框图如图1所示。 1.2 NVDK C6416的主要特点 NVDK作为网络及视频开发套件把很多音视频接口及网络接口直接做在板卡上给采用TI C6000系列DSP芯片作为处理单元的开发用户提供了便利的前端平台。它为项目演示、算法实现、原理制作、数据仿真、FPGA开发和软件优化提供了完整的DSP开发平台。其主要特点如下 ·C6416 DSP内核600MHz时钟频率及8指令并行结构最高可以达到4800MIPS的处理能力。 ·视频特点在输入端NVDK能够捕获PAL制或NTSC制的模拟视频信号可以采用复合视频CVBS或者S-video视频信号输入输入模拟视频信号被数字化为YUV422数字视频格式。在输出端NVDK在支持复合视频CVBS以及S-Video输出的同时还提供了SVGA输出模式视频采集提供FULL、CIF和QCIF三种图像格式视频输出提供FULL和 CIF两种图像格式。 ·音频特点提供两路双声道音频输出CD音质的输入输出立体声接口另外还提供一路单声道的麦克风输入。 ·主接口提供了PCI接口允许与PC机相连。该板既可以以PCI模式运行也可以单独脱机工作。 ·网络接口以太网接口为视频码流的网络传输带来了方便。 ·外部扩展存储器256M 64位宽扩展内存SDRAM和8M 32位宽扩展内存SDRAMB及4MB FLASH ROM提供了跤的内存空间和灵活的内存分配方案。 2 H.264视频压缩标准 H.264是由ITU-T视频编码专家组VCEG和ISO/IEC移动图像专家组MPEG共同提出的最新国际视频编码标准。它在H.264、H.263视频压缩标准的基础上进行了进一步的改进和扩展。其目的是为了进一步降低编码率提高压缩效率同时提供一个友好的网络接口使得视频码流更适合在网络上传送。由于该标准可以提供更低的码率所以更适合应用于多媒体通信领域。 H264主要有以下新特点 ·网络适配层NALNetwork Abstraction Layer。传统的视频编码编完的视频码流在任何应用领域下无论用于存储、传输等都是统一的码流模式视频码流仅有视频编码层Video Coding Layer。而H.264根据不同应用增加不同的NAL片头以适应不同的网络应用环境减少码流的传输差错。 ·帧内预测编码模式Intra Prediction Coding。帧内预测编码合理地利用了I帧的空间冗余度从而大大降低了I 帧的编码码流。 ·自适应块大小编码模式Adqptive Block Size Coding。 H264允许使用16×16、16×8、8×16、8×8、8×4、4×8、4×4等子块预测和编码模式采用更小的块和自适应编码的方式使得预测残差的数据量减少进一步降低了码率。 ·高精度亚像素运动估计High precision sub-pel Motion Estimation。 H.264中明确提出了运行估计采用亚像素运动估计的方法并制定1/4像素和1/8像素可选的运动估计方法。亚像素运动估计提高了预测精度同时降低了残差的编码码率。 ·多帧运动补偿技术Multi-frame Motion Compensation。传统的视频压缩编码采用一个P帧或两个B帧解码帧作为当前帧预测的参考帧。在H.264中最多允许5个参考帧通过在更多的参考帧里进行运动估计和补偿找到列差更小的预测块降低编码码率。 ·整形变换编码Inter Transform Coding。 H.264采用整形变换代替DCT变换整形变换采用定点运算代替浮点运算。采用这种变换不仅可以降低编解码的时间而且为该算法在多媒体算是平台上实现带来了方便。在这一点上H.264视频编码标准更适合作为多媒体终端的编解码标准。 ·两种可选择熵编码CAVLC和CABAC。 CAVLCContext-based Adaptive Variable Length Coding基于内容的自适应变长编码。 CABACContext-basedAdaptive Binary Arithmetic Coding:自适应二进制算术编码。以往的视频压缩标准中都采用Huffman编码与变长编码相结合的方法进行熵编码。 Huffman编码虽然是一种很好用的熵编码方法但是其编码效率并不是最高的而且Huffman编码的抗差错性能很低。H.264中采用了两种可以选择的熵编码方法CAVLC编码抗差错能力比较高但是编码效率不是很高CABAC编码是一种高效率的熵编码方法但是计算复杂很高。两者各有优缺点所以针对不同的应用选择不同的编码方法。3 H.264解码器算法的DSP实现和优化 3.1 在PC机上实现H.264算法并进行优化 ITU-T官方提供的H.264的核心算法不仅在代码结构上需要改进而且在具体的核心算法上也需要做大的改动才能达到实时的要求。这一步需要做的具体工作包括去处冗余代码、规范程序结构、全局和局部变量的调整和重新定义、结构体的调整等。 3.2 PC机H.264代码的DSP化 C6000开发工具Code Composer Studio有自己的ANSIC编译器和优化器并有自己的语法规则和定义所以在DSP上实现H.264的算法要把PC机上C语言编写的H.264代码进行改动使其完全符合DSP中C的规则。这些改动包括去除所有的文件操作去除可视化界面的操作合理安排内存空间的预留和分配规范数据类型——因为C6416是定点DSP芯片只支持四种数据类型short型16 bit、int(32bits)、long型(40bits)和double型64bits因此必须对数据进行重新规范把浮点数的运算部分近似用定点表示或用定点实现浮点运算根据内存的分配定义远近程常量和变量把常用的数据在数据结构中提取出来以near型数据定义在DSP内部存储空间以减少对EMIF端口的读取从而提高速度。 3.3 H.264的DSP算法优化通过把PC机H.264代码DSP化可以在DSP上实现H.264的编解码算法但是这样实现的算法运行效率很低因为所有的代码都是由C语言编写并没有完全利用DSP的各种性能。所以必须结合DSP本身的特点对其进一步优化才能实现H.264视频解码器算法对视频图像的实时处理。对DSP代码的优化共分为三个层次项目级优化、C程序级优化、汇编程序级优化。 1项目级优化主要是通过选择CCS提供的编译优化参数根据H.264系统的要求进行优化通过不断地对各个参数-mw -pm -o3 -mt等的选择、搭配、调整改善循环、多重循环体的性能进行软件流水从而提高软件的并行性。 2C程序级优化主要是针对采用的DSP的具体特点进行代码的功能精简、数据结构的优化、循环的优化、代码的并行化处理。在这里主要工作包括以下部分去除掉SNR计算、帧率及其他辅助信息的程序模块。函数及数据映射区域的调整把经常用的数据存储在片内存储器中频繁调用的程序尽可能映射在相邻或相近的存储区域。C函数的并行化处理针对并行化效果差的函数尤其是多重循环体要进行循环拆解将多重循环拆解为单重循环。减少存储区数据的读取和存储尤其是片外存储区域数据的调用以减少时间。数据结构的重定义和调整。下面以数据结构的调整说明如何合理利用DSP特性进行软件优化。数据结构是指数据的类型及其在内存空间的分配方式不同的数据结构对程序的性能有不同的影响。因此数据结构的调整对程序在DSP上并行执行是必不可少的步骤。在H.264解码器内核代码中数组mpr[i][j]用来存放一个宏块的预测系数数据类型是int型其中i、j是该系数的坐标。但是预测系数实际上只有8位位宽所以定义成byte型就足够了。这样一方面节省了内存空间另一方面用 byte类型可以直接使用LDW指令代替LDB指令一次读取4个数据节省了读取时间。因此H.264中对系数的读取都是以块为单位的而内核中的 mpr数据结构显然不能充分利用DSP的特性所以数据存储结构也需要调整把mpr中每一个块分配到一个连续的内存空间有利于数据的传送如图2所示。这样每一次确定了一个块以后只要更改一维的信息就能确定系数的位置而原始的结构对每一个系数都有确定两位系数。通过这样的数据调整可以明显地提高程序的运行速度。 3汇编程序级优化。汇编级的优化包括两部分采用线性汇编语言进行优化和直接用汇编语言进行优化。由于系统编译器的局限性并不能将全部的函数都很好地优化这样就需要统计比较耗时的C语言函数用汇编语言重新编写。这些函数包括插值函数、帧内预测函数、整形反亦换等函数。下面以差值函数中的一段来说明汇编编写带来的性能提高。横向1/2插值源代码for(j0;jBLOCK_SIZE;j){ for(i0;iBLOCK_SIZE;i){ for(result0,x-2;x4;x) resultmref[ref_frame][y_posj][x_posix] *COEF[x2]; block[i][j]max(0,min(255,(result16)/32)); } } 该段代码采用一个六阶滤波器来插值1/2位置的像素值共插出16个值一个块。源代码采用三重循环内层循环是插值滤波器如果直接用编译器把源泉代码编译成汇编的话内部循环都要反复读取一些内存数据。采用汇编自己编写则可以改进算法大大降低函数的运行时间。如图3所示在插值第一个半像素位置时要在内存中读取16像素的值插值第二个半像素位置时要读取27点的值这样就反复读取了25像素点的值而且插值一个点需要进行6次乘法、5次加法。用汇编语言编写手工排流水线可以降低数据的读取次数同时减少了乘、加法指令数。首先采用LDNW指令直接读取8个数据到寄存器中每次插值直接使用寄存器而不再去内存中读取数据。另外采用DOTPSU4乘累加命令代替MPL指令将四次乘法和3次加法用一条指令来代替减少了指令数目。通过以上各种优化方法最终实现了基于C6416内核的H.264 baseline解码器算法。 4 算法性能的评测及前景展望在NVDK C6416环境下测试了解码器算法对QCIF测试序列已经能够达到5060帧/秒的解码速度远远达到了实时性解码的目的。在NVDK C6416板卡上实现的H.264视频解码器具有功能强、使用灵活等特点有广泛的应用前景。该优化的算法不仅适用于NVDK板对于所有的C64开发板都具有通用性只要根据板卡的内存分配重新配置内存参数文件便可以把该算法移植到新的开发板中。该H.264视频解码器与网络平台相连接便可以应用于视频会议、可视电话、无线流媒体通信等应用领域。

查看全文

http://www.pierceye.com/news/932400/