注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

无线时代辐射无穷

抓紧生宝宝,小心辐射

 
 
 

日志

 
 

华硕主板bug,CPU过热,老出现Tmid Thermal event with intelligent throttling disabled  

2011-06-15 08:00:25|  分类: linux |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |


Message from syslogd@ at Fri Jan  8 14:19:13 2010 ...
training kernel: CPU0: Temperature above threshold, cpu clock throttled
Message from syslogd@ at Fri Jan  8 14:19:13 2010 ...
training kernel: CPU2: Temperature above threshold, cpu clock throttled
Message from syslogd@ at Fri Jan  8 14:19:13 2010 ...
training kernel: CPU3: Temperature above threshold, cpu clock throttled
Message from syslogd@ at Fri Jan  8 14:24:13 2010 ...
training kernel: CPU0: Temperature above threshold, cpu clock throttled
Message from syslogd@ at Fri Jan  8 14:24:13 2010 ...
training kernel: CPU2: Temperature above threshold, cpu clock throttled
Message from syslogd@ at Fri Jan  8 14:24:13 2010 ...
training kernel: CPU3: Temperature above threshold, cpu clock throttled
        在网上找了很多文档,后来发现几个可能相关的文档,这里汇总一下:
首先是 http://www.linuxquestions.org/questions/linux-software-2/temperature-abo... ,但是按照其中方法执行rmmod asus_acpi命令之后,仍然没有阻止该消息再次出现。

然后是 http://www.centospub.com/bbs/viewthread.php?tid=3837 ,如下:


messages日志提示
CPU0: Temperature above threshold
CPU0: Running in modulated clock mode
根据资料,这应该是2.6内核的相应阀值过低造成的.特别在编译程序的时候出现的频率很高.
关闭的解决办法如下:
vi /etc/syslog.conf
注释掉 *.emerg 这一行
/etc/init.d/syslog restart
一切OK
这种方法属于典型的治标不治本,并且可能会影响到其他的严重警告信息显示。

后来又找到一种方法,http://www.linuxsir.org/bbs/thread305266.html ,可能会更好一些,也算是没有办法的办法:


关掉内核中mce即可,或者在引导内核的命令中加入nomce
在此服务器的实际操作命令是修改/boot/grub/menu.lst文件,如下:
        kernel /vmlinuz-2.6.18-164.9.1.el5.centos.plus ro root=LABEL=/ nomce
        initrd /initrd-2.6.18-164.9.1.el5.centos.plus.img
即在第一行末尾加上nomce指令。但是之前我可以确定CPU没有过热问题。
重新启动之后,世界清静了。
华硕P5BV-C, 2GFBD ECC,E5505,CENTOS5.5 64位,在完全无征兆的情况下出现。而且是在所以tty上都不停的出现,以致于无法操作..
dmesg:
EDAC i5000 MC0: FATAL ERRORS Found!!! 1st FATAL Err Reg= 0x4
EDAC i5000 MC0: >Tmid Thermal event with intelligent throttling disabled
EDAC MC0: UE row 1, channel-a= 0 channel-b= 1 labels "-": (Branch=0 DRAM-Bank=2 RDWR=Read RAS=446 CAS=0 FATAL Err=0x4)
经过研究,在INTEL的文档上找到了答案,这是intel5000系列芯片组的一个BUG....晕死...
在下面这个文档的208页,第3.9.22小节
http://www.intel.com/Assets/PDF/datasheet/313071.pdf
通过以下这个命令可以临时关闭这个信息
echo "0" >/sys/devices/system/edac/mc/log_ue
如果要永久关闭,则要在/etc/modprobe.d/blacklist 里面加上
blacklist i5000_edac
这么一句即可。

 

 

  评论这张
 
阅读(1351)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017