摘 要: | 拥有高精度蒙皮和复杂骨骼绑定关系的骨骼动画,渲染时存在很大的性能瓶颈。以往研究采用GPU加速动画,但高端GPU成本过高,而中低端GPU的通用计算性能有时不如高端CPU。为充分挖掘算法在多核CPU上的执行性能,弥补中低端GPU通用计算性能的不足,提出了基于Open CL的针对指令和线程的新兴集成并行方案,并与基于SSE结合Open MP针对指令和线程的传统独立并行方案展开对比。实验结果表明,在多数CPU和多种复杂度的数据上,基于Open CL的新兴并行方案的性能明显高于基于SSE的传统并行方案,并且性能优势随着数据复杂度的增加而提升。
|