芯瞳半导体有效确定GPU任务复杂度
时间:2022-03-29来源:佚名
GPU芯片初创企业芯瞳半导体日前完成Pre-A轮融资,芯瞳创始人表示,“如今,芯瞳在GPU芯片设计领域已实现核心技术环节的自主创新,我们依旧坚持脚踏实地做好产品”。
目前,图形处理器在执行CPU所下发的任务过程中,通常会针对各被执行的任务进行调度。由于各任务之间的复杂程度各不相同,高复杂度的任务通常会占用GPU更多的计算资源,针对高复杂度的任务会通过调度来降低GPU的计算资源占用从而节省功耗。优先级也是针对任务进行调度时所需要考虑的,尽管高优先级任务的复杂度较高,GPU资源也会更多的倾向高优先级任务。
为此,芯瞳半导体于2021年9月6日申请了一项名为“应用于GPU的确定任务复杂度的方法、装置及介质”的发明专利(申请号: 202111036976.0),申请人为西安芯瞳半导体技术有限公司。
图1 计算装置框图
图1为计算装置框图,其中包括:处理器6、系统存储器10和GPU12。还可包含显示处理器14、收发器模块3、用户接口4和显示器8。收发器模块和显示处理器可为与处理器和/或GPU相同的集成电路(IC)的部分。处理器可为微处理器,例如中央处理单元(CPU),其经配置以处理供执行的计算机程序的指令。处理器可包括控制计算装置的运算的通用或专用处理器。用户可将输入提供到计算装置,以致使处理器执行一或多个软件应用程序。另外处理器还可以执行控制GPU运算的GPU驱动程序22。用户可经由一或多个输入装置将输入提供到计算装置。
GPU执行图形运算,从而将一或多个图形图元渲染到显示器。因此,当在处理器上执行的软件应用中的一者需要图形处理时,处理器可将图形命令和图形数据提供到GPU以渲染到显示器。图形数据可包含绘制命令、状态信息、图元信息、纹理信息等。在一些情况下,GPU可内置有高度并行结构,其提供比处理器高效的对复杂图形相关运算的处理。
图形存储器40可为GPU的一部分。因此,GPU可在不使用总线的情况下在图形存储器中读取或写入数据。换句话说,GPU可使用本地存储装置而不是芯片外存储器在本地处理数据。此类图形存储器可被称作芯片上存储器。这允许GPU通过消除GPU经由总线读取和写入数据的需要来以更高效的方式操作,其中经由总线操作可经历繁重的总线业务。
图2 应用于GPU的确定任务复杂度方法流程示意图
图为应用于GPU的确定任务复杂度方法流程示意图,该方法包括:首先接收由GPU驱动程序22下发的当前被执行的任务(S401);然后将所述任务划分为多个子任务,并将所述子任务轮询调度至作为可编程执行核24的处理核300以执行(S402);相应于所有处理核300均被对应分配子任务且剩余子任务尚未被分配,基于已分配子任务的处理核300的warp执行时长预测执行所述剩余子任务的耗时(S403);最后当执行所述剩余子任务的耗时满足设定的判定条件时,确定所述当前被执行的任务为高复杂度任务(S404)。
简而言之,芯瞳半导体的GPU确定任务复杂度专利,通过将子任务轮询调度至作为可编程执行核的处理核以执行并预测任务耗时,能够实时确定任务复杂度,从而为GPU的计算资源实时调度提供依据。
芯瞳半导体是一家专注于图形图像渲染、高性能计算领域GPU芯片设计的高科技企业,以“支撑算力自由的文明世界”为愿景,致力于打造业界领先的GPU芯片设计平台。未来芯瞳将进一步推动GPU相关应用场景的落地。
|