这是一篇英文翻译,原文见这里
异构应用程序,也即同时在 CPU 和 GPU 等多个处理器上运行代码的应用程序,具有天生难以优化的内在特性。您不仅需要考虑代码的不同部分在不同处理器上执行的情况如何,还需要思考它们之间的交互效率。是否有哪个处理器在不必要地等待其他处理器?是否不必要地复制了大量的存储器数据?对 GPU 的利用程度是怎样?是否有瓶颈?了解所有这些的复杂程度让胆小者望而却步。
显然,至少在部分程度上,答案是性能分析工具。DS-5 Streamline 性能分析器就是这样的一款工具,它最近还新…