这篇文章提供chrome基于硬件加速的组合实现的背景和细节说明:为什么用硬件合成传统式,web浏览器完全依赖CPU来渲染网页内容,但是随着现在GPUs的能力以及能够以更小的体积嵌入设备,人们逐渐把关注点转向寻找更有效地使用基础硬件来实现更好的性能和节省电源消耗,使用GPU来合成网页内容能够带来非常明...
分类:
其他好文 时间:
2014-09-24 11:36:36
阅读次数:
334
1. GPU在处理能力和存储带宽上比CPU更优势,这是由于GPU芯片更多的面积(也就是更多的晶体管)用于计算和存储,而不是控制(复杂控制单元和缓存)。
2. 指令级并行-->线程级并行-->处理器级并行-->节点级并行
3. 指令级并行办法:超标量,乱序执行,超流水,超长指令字,SIMD,分支预测。超长指令字可以减少访存。
4. 超长流水线会带来效率问题,需要更精准的预测功能和更大规模的缓存.......
分类:
其他好文 时间:
2014-09-23 21:17:47
阅读次数:
472
安兔兔等跑分软件能帮助手机用户了解自己手机的性能,此功能迎合了大多数人的需求,因此安兔兔较流行。当然目前市面上不止一款跑分软件,这些跑分软件大同小异,基本原理是:通过模拟用户操作(比如玩游戏,做运算,听音乐等等)来测试CPU,GPU,MEM,WIFI,BLUETOOTH,MODEM,DDR等等性能,给每一项进行打分,最后形成总分。
认真做技术的芯片供应商,集成商会不断突破已有技术,从而提高产品性...
分类:
移动开发 时间:
2014-09-23 18:50:05
阅读次数:
250
根据几年的CUDA开发经验,简单的介绍下CUDA程序的大概开发步骤,按照先修改CPU串行程序后移植到GPU平台的原理,把需要在GPU上做的工作尽量先在CPU平台上修改,降低了程序的开发难度,同时有利用bug的调试。通过实现一种快速、有效地CUDA并行程序开发的方法,提高CUDA并行程序开发效率,降低CUDA并行程序开发周期和难度。
(1) CPU串行程序分析
对于CPU串行程序,首先需要...
分类:
其他好文 时间:
2014-09-22 20:49:33
阅读次数:
139
在整个过程中出现了各种问题,我先将我调试好的真个项目打包,提供下载。 1 /* 2 * Copyright 1993-2010 NVIDIA Corporation. All rights reserved. 3 * 4 * NVIDIA Corporation and its licensors....
分类:
其他好文 时间:
2014-09-21 21:13:51
阅读次数:
417
雾 : 说白了就是一层有颜色的(一般是白色,灰色) 蒙蒙的感觉 混在光线里面。 不管是白天还是黑天。
龙书里面是这样实现的:
1. 给雾定义一个颜色 float3 gFogColor={0.7f,0.7f,0.7f};
2. 然后呢在顶点着色器里面计算出 顶点级别的雾化需要的颜色加成比例
加成比例: 意思是当距离摄像机,就是你的眼睛越远,雾的浓度越大,就是颜色越深。 根据这个得出一个(0...
分类:
其他好文 时间:
2014-09-21 19:14:01
阅读次数:
378
Core Image是一个很强大的框架。它可以让你简单地应用各种滤镜来处理图像,比如修改鲜艳程度, 色泽, 或者曝光。 它利用GPU(或者CPU)来非常快速、甚至实时地处理图像数据和视频的帧。并且隐藏了底层图形处理的所有细节,通过提供的API就能简单的使用了,无须关心OpenGL或者OpenGL ES是如何充分利用GPU的能力的,也不需要你知道GCD在其中发挥了怎样的作用,Core Image处理了全部的细节。本文将会提到人脸检测以及简单的马赛克处理。...
分类:
移动开发 时间:
2014-09-20 10:02:57
阅读次数:
327
安装好CUDA6.5+VS2012,操作系统为Win8.1版本,首先下个GPU-Z检测了一下:
看出本显卡属于中低端配置,关键看两个:
Shaders=384,也称作SM,或者说core/流处理器数量,数量越大,执行并行线程越多,单位时间计算量也就越大。
BusWidth=64Bit,这个越大,数据的处理速度也就越快
接下来看...
分类:
其他好文 时间:
2014-09-18 22:22:20
阅读次数:
420
公司名称AMD(超微半导体公司)经营范围CPU、显卡、主板等电脑硬件设备AMD公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、APU、主板芯片组、电视卡芯片等)、闪存和低功率处理器解决方案,AMD致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客...
分类:
其他好文 时间:
2014-09-18 21:53:44
阅读次数:
335
数据传输测试,先从主机传输到设备,再在设备内传输,再从设备传输到主机。H-->DD-->DD-->H 1 // moveArrays.cu 2 // 3 // demonstrates CUDA interface to data allocation on device (GPU) 4 // an...
分类:
其他好文 时间:
2014-09-18 18:27:54
阅读次数:
189