大佬们,集成开发环境可以把系统装在U盘盘里吗

微信扫码随时发布需求
贤集网技术服务平台欢迎您
访威力总经理施彦仰:向工业以太网更高带宽进发
工业以太网兴起于2000年,到2005年逐渐被市场所关注。也正是这一年,威力工业网络股份有限公司(下称ORing)现任全球CEO及创始人施作君先生带着一群伙伴,在自家地下室开始了创业之旅。随后,研发出一款环网冗余协议O-Ring,将网络自愈时间缩小至10个毫秒以内。ORing,就此起步。
十多年来,从最初的研发小组,发展成一家产品远销欧美的公司,ORing都经历了哪些发展阶段?产品覆盖了哪些领域?面对新的机遇与挑战,又将会有哪些部署?7月9日下午,威力工业网络股份有限公司总经理施彦仰先生接受了笔者的采访,并对以上问题一一作了解答。
(威力工业网络股份有限公司总经理施彦仰先生)
威力工业网络股份有限公司(ORing)专注于工业通讯网络产品的研发与制造,为客户提供适应于各种严苛环境下的以太网通讯、无线通讯,以及串口设备联网解决方案。2005年到2008年,是为ORing品牌正式成立前夕,创始人及其团队主要从事技术研发、产品设计工作,环网冗余协议O-Ring正是ORing在这一时期研发出的一款独有的网络自愈技术。
“与一般普通商业交换机不同,工业生产现场对工业以太网的可靠性要求非常高,而环网协议可以在通讯链接发生故障时,以最短的时间实现网络自愈。ORing正是基于此研发了环网冗余协议O-Ring。”施彦仰介绍说。这款环网冗余协议O-Ring能够使环网自愈时间小于10ms,远远领先于其他同行。“这算是ORing的起步阶段。”
2008年,ORing品牌正式成立,并由此展开全球市场的产品部署,当时主要以欧洲和美国为主。“直至2010年,ORing来到中国大陆。”施彦仰说。
“进入中国大陆后,ORing凭借着软件设计出身的优势,前期主要为客户提供定制化服务,并没有过多的进行市场的部署。”施彦仰介绍说。2013年ORing在中国大陆成立子公司,即现在的——唯栎电子科技(上海)有限公司。
因地制宜,产品覆盖众多领域
ORing产品覆盖轨道交通、智能交通、电力、智能工厂、冶金、石油天然气、新能源等众多领域。此外,据施彦仰透露,作为ORing重点部署的市场,中国、欧洲和美国三大市场的重点领域有所不同。
“目前,ORing在大陆的所有产品中,轨道交通领域所占市场份额比重最高。欧洲作为ORing最先铺设的海外市场,在轨道交通与智能交通等行业的发展整体向好。针对美国市场的部署,ORing主要以服务定制化大客户为主,同时也在不断地进行品牌推广。”施彦仰说,“中国、欧洲与美国三大市场各占ORing市场总份额的20%-30%。”
ORing于2010年进入中国大陆,彼时正是轨道交通迅速发展时期。在保障轨道交通正常运营中,工业网络系统起着关键作用。信号控制、乘客信息读取、车辆和地面信息的交互,这一切都需要构建完整而可靠的工业网络。轨道交通环境条件严酷、温度极端、磁场干扰大,这对产品的研发制造提出了很高的要求。
对此,ORing研发出一系列通过EN轨道认证的工业网络产品,包括所有交换机端口都支持M12航插方式、支持旁路功能、网络快速冗余、无线产品无缝漫游时间短、高速切换等技术特点,所有产品经过严格测试,无论是在列车车载还是轨旁环境应用下都十分适合。同时,ORing通过IRIS认证,证明了ORing在生产流程和管理上的高度合规。随着时间的推移,ORing也积攒了大量的轨道交通应用,已经在京沪高铁、京津铁路、沪昆客运专线、沪杭铁路、包兰铁路等长期稳定运行。尤其在高铁上,例如中国标准动车组复兴号车载PIS系统,同样也随着中国高铁走出去的战略,ORing车载交换机和无线AP系列还分别应用在苏丹内燃动车和马来西亚动车上。
(ORing助力复兴号车载PIS系统)
与此同时,ORing也在拓展地铁和有轨电车市场。在地铁方面,ORing还是上海地铁11号线、16号线的AFC系统、上海地铁车库无线覆盖、北京地铁8号线三期CBTC车载信号系统、重庆地铁5号线CBTC系统以及蒙自有轨电车车载AFC系统等的供应商。
智能交通是ORing产品在美国市场应用最多的领域。智能交通系统(Intelligent Transportation System,简称ITS)是未来交通系统的发展方向,它是将先进的信息技术、数据通讯传输技术、电子传感技术、控制技术及计算机技术等有效地集成运用于整个地面交通管理系统而建立的一种在大范围内、全方位发挥作用的,实时、准确、高效的综合交通运输管理系统。在智能交通行业,ORing主要应用在道路交通安全监控系统等。
(道路交通安全监控系统构架图)
在电力的整个阶段,包括发输变电、配供电,其可靠性和稳定性至关重要,这也意味着工业以太网交换机在电力行业大有可为。2007年到2010年是大陆工业以太网发展最快的三年,而对于2010年才进入大陆的ORing来说,并没有在这一行业占据太多份额。“ORing错过了,不过ORing仍然不会放弃这一领域。”施彦仰说。
但是ORing在新能源发电环节,如光伏发电以及风力发电,也是取得很多成绩的。例如,在格尔木的“追日系统”中,有上千片太阳能电池板,就像一朵朵向日葵,永远追随着太阳的方向,这里正有ORing的身影。在格尔木50兆瓦聚光光伏发电系统中,每台太阳能电池板都配有一台PLC作为“追日系统”的控制器,为了将现场的数据与控制室进行有效的连接,ORing构建了一套可靠且稳定的工业以太网,就像布满身体的神经系统,将控制室的指令传递给每台PLC,或者将每台PLC的数据传回控制室,从而实现在控制室全方位控制所有的太阳能电池板,有效提升了“追日系统”的效能。
(格尔木50兆瓦聚光光伏发电系统项目一期、二期架构图)
在上述应用中,除了O-Ring快速网络冗余技术,还包括独有的O-Chain。O-Chain是一种可灵活扩展的网络冗余技术,只需将O-Chain上的“首端”和“尾端”交换机就近接入环形网络,即可实现快速的网络自愈功能。因此O-Chain是一种面向未来的网络冗余技术,其组网的便捷性和扩展的灵活性可以实现更大范围的冗余网络覆盖,全面提升网络通信效率。
试水IIoT工业物联网 规划智慧城市蓝图
手机的出现取代了传呼机,智能手机的出现取代了传统手机。正是从诸如此类的变化中获得启示,ORing认为,工业通讯技术也会有较大更新。“作为传统的工业通讯商,如果不加以改变,等待你的只能是被取代。”施彦仰说。基于对未来的预估,ORing于2017年宣布进入IIoT工业物联网行业。“ORing并不担心市场或者产品进入成熟期,而是担心市场对我们的产品不再需要。”施彦仰说。
施彦仰的担忧不无道理,在他看来,5G技术、NB-IoT等技术,在某种程度上或许会取代现有的工业以太网交换机。而上述技术的兴起,又将催生更多应用。“这是从新的工业通讯技术对ORing倒逼的角度来谈。还有一个原因是我们现在做的事情,需要IIoT工业物联网的支持。”施彦仰补充说。ORing专注于工业以太网,包括交换机、AP、WiFi、工业路由器等产品,ORing必须选择IIoT工业物联网。
(ORing IoT解决方案概览图)
在他看来,IIoT工业物联网需要精细化区分,智能路灯就是其中一个细分行业。据施彦仰介绍,目前,ORing已经可以提供一个完整的智能路灯解决方案,帮助用户从现场调研、安装到照明控制(包括调度和维护)一系列的智能路灯应用的开发。
然而ORing研发设计的智能路灯,不仅可以优化整个城市的路灯管理、进一步节省能源,更重要的是对智慧城市这一宏伟蓝图的实践。“智能路灯是智慧城市的重要动脉,短时间内不会被取代,因此我们会把它利用起来。”施彦仰介绍说。在路灯的灯杆上安装传感器,对空气质量、井盖、人流量、车流量等数据进行采集。“在5G时代,还可以安装微基站。”施彦仰补充说。
在今年6月5日举行的台北电脑展上,ORing针对智能路灯系统,除带来硬件路灯控制设备之外,还展示了MagiCITY管理平台的应用。使用者借助MagiCITY管理平台,可以通过电脑或手机端的操作,实时远程控制路灯照明,并通过大屏幕随时查看路灯数据和分析图。
(ORing智能灯控解决方案在全球的应用)
据施彦仰介绍,MagiCITY管理平台涵盖了智能城市所需的各类工业应用,支持Modbus-RTU和Modbus-TCP,使得开发人员可以将传感器、仪表和其他设备轻松连接到PaaS层。MagiCITY管理平台还支持数十亿台设备,能够安全可靠地传送城市的实时数据,便于智慧城市相关应用进行分析。不仅如此,MagiCITY管理平台还提供RESTAPI,方便追踪设备的连接状态,即使设备处于离线状态,也可以随时访问IIoT设备和数据。关于智能路灯在国内的落地,施彦仰说:“ORing会在今年年底重新梳理客户,定位市场。”
打造高速带宽 引领智能未来
作为一家深耕于工业以太网行业的企业,ORing十多年来逐渐积累了众多项目资料和实践经验。“不管是智能路灯还是智慧城市,我们有许多相对成熟的解决方案。那么如何将这些资料为我所用?这是我们需要考虑的问题。”施彦仰说。目前,ORing已经和百度建立了合作伙伴关系,同时还在寻求与微软公司的合作。“我们希望能够和他们共同进行人工智能、机器学习等领域的技术、产品研发。”
而面对工业以太网行业快速更新的通讯技术,ORing也有自己的计划。“现阶段不管是云平台、终端还是控制器,发展趋势很快,但是发展方向并不明确。不过毫无疑问的是,将来都会对带宽提出更高要求,因此我们必须向更高的带宽发展。” 施彦仰说,“未来2-3年,ORing的目标是架构更便捷的高速工业以太网(有线网络),我们目前已经推出了非常完善的全千兆交换机系列,接下来我们会完善2.5G交换机乃至万兆交换机的产品系列,让用户可以充分体验高速的乐趣!”
在ORing看来,有线网络达到千万级别带宽完全可以满足不确定需求。而对于无线网络,“由于现在的5G技术标准并不确定,我们需要探索新的无线通讯方式,例如NB-IoT、LoRa。”施彦仰如是说。
本文摘自:中国工控网
声明:“贤集网”的所有作品,版权均属于贤集网,如需转载,请注明出处;本网站转载的内容版权归原网站所有,如有侵权或其他问题,
请及时通过电子邮或者电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失
相关专题推荐
以太网交换机
我来说几句
还没有人评论哦,抢沙发吧~
意见被贤集网采纳后,贤集网赠送一张限量版的U盘会员卡!
联系方式(必填)
您的意见(必填)
贤集网微信二维码
400-615-8109
周一至周五9:00-17:30
广告合作热线:
Copyright (C)2014USB为什么复杂,因为USB标准内容太多了.
Android上的USB外围设备.我见过指纹,鼠标,触摸屏,U盘.大部分人用USB充充电.USB的介绍网上已经很多了,我以移植一个USB触摸屏来说明我的理解.
Android上USB的API android.hardware.usb.UsbManager,函数也不多,就是不好用,一个涉及到权限,另外一个涉及到协议.
先解决表面上的问题,这和android权限机制有关系.
在AndroidManifest.xml加入
&uses-permission android:name="android.hardware.usb.host" /&
&uses-permission android:name="android.hardware.usb.accessory" /&
怎么找到我的设备呢?
mManager = (UsbManager) c.getSystemService(Context.USB_SERVICE);
HashMap&String, UsbDevice& list = mManager.getDeviceList();
for (UsbDevice usb : list.values()) {
int pid = usb.getProductId();
int vid = usb.getVendorId();
遍历list,打印出pid和vid号,看和你实际对应pid,vid号是不是一样呢?
如果你没看到usb设备呢?我想大部分人会遇到,有人会说你没把vid,pid号加入usbfilter.xml文件里.不要被误导,这只和热插拔设备弹出应用有关,系统检测热插拔,和getDeviceList无关,getDeviceList会获取所有usb设备.
参考这篇文章基本能解决,因为android很多版本都不完善.
http://blog.csdn.net/trbbadboy/article/details/8929673
mDeviceIntf = mDevice.getInterface(0);
mDeviceConnect = mManager.openDevice(mDevice);
mDeviceConnect.claimInterface(mDeviceIntf, true);
第四步(可选):
google这点做的不厚道,什么东西都要求权限,上个厕所都得申请,虽然可以记住用户选择,可别忘了usb是热插拔设备,你拔完之后,从新插入又是一个新设备,又得申请权限,而且申请过程中遇到卡死的情况.怎么避免requestPermission()带来的提示呢?
答案在这里,修改所有的申请都为通过.
frameworks/base/services/java/com/android/server/usb/UsbSettingsManager.java
这是得修改系统源码.
协议是复杂的问题,controlTransfer参数搞不懂,什么意思?所以得参考usb协议,不能自己瞎想.
一个命令格式:bmRequestType + bRequest + wValue + wIndex + wLength ,总共8个字节
当然命令+=数据
可以这么简单理解.
bmRequest代表方向,主机-&从设备或者从设备到主机
bRequest 命令,参考表2
wValue 参数1,得仔细看协议标准,太多了
wIndex 参数2,得仔细看协议标准,太多了
wLength:接收或者发送数据的大小,不包括命令本身(8字节)
数据,根据实际情况
命令格式表9-2
我拿一帧数据举个例子,我用BusHound抓取获取描述符的命令,IN是接收到的数据
命令格式:81 06 02 03 09 04 02 02
bmRequestType = 0x80; 从设备到主机
bRequest = 0x06; 参考表9-4,GET_DESCRIPTOR
wValue = 0x0302;参数1,高位代表类型(String类型),低位代表索引值
wIndex = 0x0409;参数2
wLength = 0x0202;接收长度0x0202字节
手册里抓出来的说明
那在android上怎么用呢?这是UsbDeviceConnection的一个标准函数,这里面的参数就是上面所说的参数.
* This method transfers data starting from index 0 in the buffer.
* To specify a different offset, use
* {@link #controlTransfer(int, int, int, int, byte[], int, int, int)}.
* @param requestType request type for this transaction
* @param request request ID for this transaction
* @param value value field for this transaction
* @param index index field for this transaction
* @param buffer buffer for data portion of transaction,
* or null if no data needs to be sent or received
* @param length the length of the data to send or receive
* @param timeout in milliseconds
* @return length of data transferred (or zero) for success,
* or negative value for failure
public int controlTransfer(int requestType, int request, int value,
int index, byte[] buffer, int length, int timeout) {
return controlTransfer(requestType, request, value, index, buffer, 0, length, timeout);
我们试着发送一下上面抓取的数据
void test()
byte [] rcv = new byte[0x0202];
int r = mDeviceConnect.controlTransfer(
0x3 && 8 | 0x2,
0x4 && 8 | 0x9,
ComFunc.log("is test log", rcv, 64);
/Timeline( 762): Timeline: Activity_windows_visible id: ActivityRecord{419df0c8 u0 com.ou.usbtp/com.ou.ui.DemoActivity
t24} time:
I/MLog ( 4562): is test log{
I/MLog ( 4562): 2c,03,49,00,6e,00,66,00,72,00,61,00,72,00,65,00,
I/MLog ( 4562): 64,00,20,00,54,00,6f,00,75,00,63,00,68,00,20,00,
I/MLog ( 4562): 53,00,63,00,72,00,65,00,65,00,6e,00,00,00,00,00,
I/MLog ( 4562): 00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,00,};
V/RenderScript( 4562): Application requested CPU execution
和bushound抓取结果一样.
当然我们不会只做获取描述符简单的问题,我们还需要设计到配置信息和读取信息的功能.
和上面类似,只是换了命令类型,
这是我配置USB触摸屏使用到的配置信息片段,大家可以参考.
Device Length Phase Data Description Cmd.Phase.Ofs(rep) Time
------ -------- ----- -------------------------------------------------- ---------------- ------------------ ------------
37.0 CTL 21 09 05 03 02 00 40 00 SET REPORT 1.1.0 10:08:02.852
37.0 64 OUT 05 03 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 1.2.0 10:08:02.852
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 1.2.16
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 1.2.32
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 1.2.48
37.0 CTL a1 01 06 03 02 00 40 00 GET REPORT 2.1.0 10:08:02.872
37.0 64 IN 06 03 00 00 fc 00 00 80 00 00 00 00 00 00 00 00 ................ 2.2.0 10:08:02.872
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 2.2.16
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 2.2.32
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................ 2.2.48
另外一些相关涉及的方面
android usb-touchscreen驱动:
https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/tree/drivers/input/touchscreen/usbtouchscreen.c?h=v4.12-rc4
usb 2.0协议标准(英文):
http://www.usb.org/developers/docs/usb20_docs/
有兴趣一起讨论.
USB Accessory(配件模式)
USB 配件模式允许用户连接专为 Android 设备设计的
USB 主机硬件。配件必须遵守 Android
Accessory Development K...
文章选取android下linux-3.10作为分析对象,具体的UVC初始化过程可以参考csdn大神写的博客,地址是:http://blog.csdn.net/orz。
上一篇介绍了如何穿件下位机程序,现在介绍一下上位机程序如何做。上位机程序我是用C#.net做的,现在.net可谓是潮流,编起软件来极其方便,很多人在用,但是如何用.net开发一个usb上位机程...
USB口433MHz透传模块概述
VT-DTMUA5-433模块是高度集成半双工无线数据传输模块,基于德州仪器(TI)高性能CC1110 SoC芯片设计,工业级的单片机和高性能射频收发...
今天回到家,老爸的小米手机3因为触摸屏失灵导致屏幕自己乱点,手机设置了解锁图案因此被锁死120分钟,而且即使等过去也因为触屏故障无法正确输入,会再次锁120分钟。这让我很头疼,因为老爸手机上因为安全需...
近几年来,人们逐渐仰赖移动装置,例如:PDA、手机、数字相机等,相形之下,使得个人计算机(PC)失色不少。也因此,各种移动装置的连接问题就成为了焦点。   USB是目前流行的有线电连接技术,但它是属于...
没有更多推荐了,<h3 class="form-title" data-v-6b秒快速估算装修报价㎡立即计算哪位能说说u盘如何上密码wduser_给U盘加密其实很简单,下载一个叫U盘超级加密3000的U盘加密软件就可以了。
这款U盘加密的软件最大的特点是不用安装,只有一个exe文件。你把它放到你需要加密的U盘里,就可以加密U盘里的数据了。并且到任何一台电脑上都可以加密和解密,很方便。
下面我就给大家说一下如何使用U盘超级加密3000给U盘加密。
U盘超级加密3000
1把你下载的U盘超级加密3000的压缩包打开,把里面的ude.exe文件放到你需要加密的U盘里。
2 双击ude.exe,就会弹出一个密码输入框。我们输入默认的密码:888888,就可以打开U盘超级加密3000了。
3 U盘超级加密3000打开后,我们可以看到软件的窗口,然后点击相应的功能按钮进行加密和解密。
4 如果你的盘里的所有文件和文件夹都需要加密,你点击全盘加密按钮,很快你的U盘里的所有文件夹和文件都从左侧转移的右侧了。这时你的U盘上除来ude.exe,和一些系统的文件夹,就没有其他的文件和文件夹,你加密的数据就已经全部消失了。
如果你使用这些加密的文件和文件夹,只需在加密区双击你需要使用的文件或者文件夹,文件或文件夹就自动打开了。十分方便。
如果只需要加密个别的文件或者文件夹,就在数据区选择,然后点击单个加密就可以了。
解密也是一样的。
你加密后,运行ude.exe然后输入密码,就可以通过软件解密你的数据。
5 U盘超级加密3000里的金钻加密是一种高强度的加密方法,加密后,文件或文件夹是不会隐藏的,但你打开这些加密的文件必须需要密码,没有密码无法打开。
6 这个软件还有其他的功能,如文件夹伪装,文件的加锁,解锁等都很好用的。
更多回答wduser_目前使用量最多、评价最好的加密软件,是冯远征代言的“隐身侠”,永久免费的,支持各种WIN系统,可以在硬盘、移动硬盘、U盘、MP3等创建保密空间,正规厂商出的,相比个人软件,更专业正规些。 隐身侠用以保护和备份电脑中的重要文件及私密信息,隐身侠能防止电脑因维修、丢失、被黑、借用所带来的信息泄露或信息丢失的风险。 隐身侠,她能轻松保护和备份电脑、移动硬盘、U盘里的重要资料和“小秘密”。隐身侠防泄密、护隐私,让“我的东西”别人看不到,自己丢不了 还有个最方便的就是到360里找个U盘加密器,不用安装,放在U盘里就可以加密使用,很方便
热门问答1234567891011121314151617181920查看更多21222324252627282930测黄道吉日抢平台优惠当前位置: —
服务器如何维修和故障诊断
相对PC机而言服务器出故障的机率是小多了,但是它的故障给企业也带来了一些影响。作为服务器工程师除要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。
本文并不是针对某个厂家服务器故障完全手册,而是根据个人经验总结出来的一些经验思路还有一些总结案例。按照下面思路和方法基本上能够解决目前服务器更换式维修的大多数问题。而且里面的一些操作风险性也不是很大,因为服务器本身就是坏的,最坏的情况下就是它一点都不能工作了呗,(主要确认是否有数据,数据无价啊)而且现在很多厂商都有自己的客服电话关于产品问题打个电话也很方便,所以安心做啦
当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决)
一、服务器常见故障分类
二、服务器常见故障现象及其对应排错方法
三、服务器排错基本原则
四、服务器故障需要收集哪些信息
五、服务器硬件故障排错实例
六、服务器软件故障排错实例
七、服务器常见内存故障现象
一、服务器常见故障类型分类:
A.开机无显示
B.加电BIOS自检阶段故障
C.系统和软件安装阶段故障和现象
D.操作系统启动失败
E.系统运行阶段故障
二、服务器常见故障现象及其对应的排除方法
A.服务器开机无显示(加电无显示和不加电无显示)
1.检查供电环境
2.检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。)
3.按下电源开关时,键盘指示灯是否亮、风扇是否全部转动
4.是否更换过显示器,尝试更换另外一台显示器
5.插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试
6.是否添加了CPU,如果有增加CPU尝试去掉
7.去掉增加的第三方I/O卡包括Raid卡等
8.ClearCMOS(记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服)
9.尝试更换主板、内存等主要部件
10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下
B.加电BIOS自检报错
1.根据BIOS自检报错信息提示
2.查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启
3.做最小化测试
4.尝试清除CMOS
5.看能否正常进入BIOS
C.系统安装阶段故障和现象
1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表)
2.系统安装蓝屏(对蓝屏故障代码诊断)
3.安装在分区格式化的时候找不到硬盘
(阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装)
4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡)
(使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可)
5.安装过程是死机
(检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝试最小化配置安装检查是否为内存和CPU等问题)
6.引导光盘安装失败
(使用引导光盘安装失败,查看引导光盘版本是否匹配,尝试手动安装系统,如有阵列重新配置阵列引导安装)
D.操作系统启动失败
1.在系统启动自检过程中有报错(具体查看启动报错信息在定方案)
2.启动系统蓝屏(查看蓝屏代码核对)
3.进入登陆界面死机(查看进入单用户或者安全模式是否正常,进入BIOS是否正常、是否会死机,进入磁盘阵列查看阵列状态是否正常,检查测试硬盘是否有坏道,最小化配置启动)
4.忘记密码 (windows使用PE破解,linux进入单用户破解)
E.系统运行阶段故障
1.安装数据库等应用软件报错(对系统版本和软件版本是否兼容,查看报错信息是否缺少插件)
2.系统运行速度变慢(查杀病毒,检测阵列状态,测试硬盘有无坏道,重新安装系统或者修复)
3.运行蓝屏(查看蓝屏代码目录)
4.运行死机(检查进入BIOS是否死机,进入系统后测试部件温度是否正常,windows系统查看dump文件)
5.硬盘拷贝数据文件速度变慢 (测试硬盘是否有坏道,如果有阵列检查阵列状态,检查改变条带大小,与软件应用要求测试对比)
三.服务器故障排错的基本原则:
1.尽量恢复系统出厂配置
a:硬件配置:去除第三方厂商备件和非标配备件
b:资源配置:清除CMOS、恢复资源初始配置
c: BIOS、F/W、驱动程序:升级最新的BIOS、F/W和相关驱动程序
d: TPL:扩展的第三方的I/O卡是否属于该机型的硬件兼容列表(TPL)
2.从基本到复杂
a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。
b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。
c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。
3.部件交换对比测试
a:在最大可能相同的条件下,交换操作简单效果明显的部件
b:交换NOS载体,既交换软件环境
c:交换硬件,既交换硬件环境
d:交换整机,既交换整体环境
在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。一般来说不可能一次就可以准确地判断出问题的所在。这样就要求工程师要有信心和耐心。出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。总之,服务器出错后必须一步一步解决,没有捷径可言。
四、服务器故障排除需要收集哪些信息
1.服务器信息:
①.机器型号:什么厂家的机器、什么型号如:DELL R720服务器
②.机器序列号或主机编号(如:主机编号为NC)
③.是否增加其它设备,如网卡、Raid卡、内存、CPU等
④.硬盘配置,如是否做磁盘阵列,阵列级别
⑤.安装什么操作系统及版本(win2003、Redhat等)
⑥.在故障前有没有做过操作、或者运行了什么软件
⑦. BIOS版本
2.故障信息:
①.在POST自检时,屏幕显示的异常信息
②.服务器本身指示灯的状态
③.报警声和BEEP CODES
④.系统的事件记录文件
⑤. Sel日志
五、服务器硬件故障处理实际案例(因厂家机型不同,在实际问题中如果遇到相似现象,也需要具体问题具体分析,请不要盲目套用)硬件故障是指服务器硬件出现异常而导致的各类错误,由于服务器构成比较复杂,因此在检查的时候必须认真、仔细。
有一台XXX型号服务器,配有256M内存,使用一个PIIIXEON 500带2M高速缓存的处理器。
开机后没有任何显示,但系统日志上提示了一条CPU电压为0伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明)。这种错误一般是处理器电压调节模块(VRM)出错或CPU出错或CPU与CPU板块接触不良,但也可能是CPU板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。
因为CPU板块在整个服务器中,占有举足轻重的地位,如果它出错服务器是会报致命错误的,并且在系统日志中会提示致命错误,但报CPU电压报错的情况也有5%左右。我们立刻把CPU调换在另一CPU插槽中,开机后依然是刚才的那种故障。所以在初步判断中,可以排除是CPU板块坏。这时取出CPU仔细擦拭金手指,以及CPU板块中与CPU接触的地方后,开机依然无显示。相对处理器坏的情况来说处理器电压模块(VRM)出现故障的情况比较大。于是立即在另一台同型号服务器中取下一个处理器电压模块,安装在此服务器中。开机后,服务器依然没有任何显示,系统日志上依然提示CPU电压为0伏的信息,系统指示灯三灯依然不停在闪烁。这时的情况就比较明显了。于是立即从另一台同类型服务器中取下一个CPU安装后,开机正常。
有一台XXX型号服务器不显示,发现开机时系统日志没有任何信息,且系统指示灯不亮。初步判断是电源方面出现了错误。经过仔细检查,发现服务器的电源是正常的,因此最大的可能就是服务器的电源管理板出现故障。更换电源管理板后,开机显示正常。但这时,新的问题来了:自检时,用CTRL+M不能检测到硬盘。
硬盘在别的服务器上是正常的,因此立即清除此服务器的CMOS,但依然不正常。立刻上网找到此服务器的最新BIOS,升级BIOS后也不能解决问题。又检查硬盘笼子和服务器里的数据线及电源线后依然出错。这时,一般情况会怀疑是服务器的I/O板(输入输出板块)有问题。但就在这个时候,工程师发现在I/O板上有一个非XXX型号服务器标配的旧式网卡,立即去除此网卡后服务器就一切正常。
硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需要各部件之间的大力协调。建议大家在采购各元件时,都采用同一品牌原装的,并且要采用能发挥服务器性能的元件(上例中的旧式网卡即使正常也会严重影响服务器性能),这样才不会发生莫明其妙的故障。
用户需要把他的XXX型号服务器升级到双网卡,我建议他购买原装网卡,但当他看到XXX型号服务器的网卡是采用的INTEL 82559芯片后,断然决定不使用原装网卡而采用另一品牌也采用INTEL82559的网卡。过了几天,他打电话给我说,他的新网卡不能使用网络冗余及数据校验,并怀疑服务器有问题。工程师带了一个INTEL 82559网卡到用户那里,仔细检查了服务器的环境完全正常后,把INTEL82559网卡安装到机器上后一切正常。这个例子更加说明了,要发挥服务器的最大性能及功能,必须使用原品牌原装的配件。非原品牌非原装的配件,不能支持服务器的某些功能,严重的会影响到服务器的正常使用。
要避免硬件故障发生频率,服务器管理人员必须注意服务器的使用环境完全正常。比较重要的服务器必须在恒温、恒湿的环境;电压也要符合,不仅要采用UPS,还必须接地线,必须是左零线、右火线,零地电压在1~3伏。在开、关服务器上必须符合正常的流程。工作人员必须严格执行操作流程。
服务器故障现象:
一台XXX型号服务器,近期频繁出现几次蓝屏幕死机故障。趁死机关闭的机会,
将内存由原来的128M升级到512M(普通内存),并且在系统CMOS设置中选择装入(Load)最优参数设置,对内存每个单元进行检测。怪异服务器故障出现了,当我开机后,内存检测正常,但是屏幕提示须重新SETUP,按指定的[F2]键后却死机。我装个内存条招谁惹谁了,怎么会死机?而且内存检测正常啊?
服务器故障处理:
服务器出了故障就要解决,哪怕是怪异服务器故障。按照缩小故障源的思路,换回原来的内存条,逐步去掉各个部分(软驱、硬盘、光驱等),可是这个怪异服务器故障依然存在。分析可能与系统SETUP设置有关,特别是关于对内存每个单元进行检测的设置。于是,拔出电池,对电池插脚短接放电,没有奏效。看来,这个怪异服务器故障还真是顽固。后来,找到主板清除CMOS跳线设置,将插脚线由1-2改到2-3一会儿,然后恢复原位,开机正常(提示:不要轻易拔出电池,而是要找CMOS清除跳线)。再次将内存升级,调整CMOS SETUP设置,特别注意到对内存的检测,设置为检测到每兆,至此系统完全恢复正常。
服务器故障经验
这个怪异服务器故障发生的根本原因是服务器的内存缺省设置为ECC(带校验),由于使用普通不带校验的内存,而系统中设置每个单元都进行检测,所以导致了上面的故障。排除的方法是清除CMOS设置,调整有关参数设置。另外CMOSSETUP装入最优参数设置通常有2种:一种是BIOS优化参数,这种参数稳定性最好;另一种是SETUP优化参数,优化整个系统,但是需要系统支持,其稳定性不能保证最好。所以,当系统出现故障时,不妨先将稳定性最好的参数装入,解决问题后再行
一台XXX型号服务器使用8708E的raid卡在读取某个文件或运行某个软件时经常出错,或者要经过很长时间才能成功,其间硬盘不断读盘并发出刺耳的杂音,这种现象意味着硬盘上载有数据的某些扇区已坏。
一旦硬盘有比较刺耳的杂音可以尝试使用HD软件来测试硬盘时候有坏道,进入ctrl+H配置界面进行查看,阵列是否降级
六、服务器常见软故障解决思路与实例
服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。
下面分别举例说明各类软件故障的维修方法。
有一台XXX型号服务器,配置为双PIII500带521K高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module(VRM) over/under-voltage 2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它同类型服务器的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。
FIRMWARE升级方法是每个厂家的服务器都有专门的firmware升级方法和软件,以联想为例,一般需要使用PE或dos环境下使用专门的升级软件来使用,任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,最新的不是一定是最好的最稳定的才是最好的,在升级之前应该小心谨慎,升级了错误的版本和使用错误的步骤会导致机器彻底的黑屏和瘫痪。
目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。
当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。
服务器的维护人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。
一位用户说,他有一台XXX型号服务器无法安装SQL SERVER 2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是维修工程师去了他的公司查看。这台服务器所在的机房是非常标准、完善的机房,检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。
但是,用户刻的SQL SERVER 2000光盘引起了工程师的怀疑,工程师让他拿出了正版的SQL SERVER安装,结果还是不行。在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windata.exe导致一个无效的数据溢出。Windata是用户自己编写的一个程序,而且是随操作系统启动而启动的程序。立即结束掉这个进程后,再运行SQL一切正常。
对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。
还有一种软件故障是人为因素造成的,它一般是人为误操作(包括没按操作流程的操作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。
人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。正常关闭系统程序非常重要,尤其是WEB服务器,一个用户就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。
七、服务器常见内存故障现象实例
服务器常用部件除了硬盘以外就是内存了,内存为服务器主要部件以个人经验来讲它一旦出现问题不是很好来判定,因为服务器一般来讲都会由阵列功能的,一旦硬盘故障硬盘前面板会有指示灯,没有指示灯的在阵列的配置界面里面也会看到有降级或者硬盘离线的报错信息的。实在不行我们还有很多像HD等硬盘检测工具来给我们现场使用。但是内存不是很好来观察只能通过一些经验现象来判定。下面列出一些内存常见问题现象供大家参考。
常见故障一:开机无显示
内存条原因出现此类故障一般是因为内存条与主板内存插槽接触不良造成,只要用橡皮擦来回擦试其金手指部位即可解决问题(不要用酒精等清洗),还有就是内存损坏或主板内存槽有问题也会造成此类故障。由于内存条原因造成开机无显示故障,主机扬声器一般都会长时间蜂鸣(针对Award Bios而言)。
常见故障二:Windows注册表经常无故损坏,提示要求用户恢复
此类故障一般都是因为内存条质量不佳引起,很难予以修复,唯有更换一途。
常见故障三:Windows经常自动进入安全模式
此类故障一般是由于主板与内存条不兼容或内存条质量不佳引起,常见于高频率的内存用于某些不支持此频率内存条的主板上,可以尝试在CMOS设置内降低内存读取速度看能否解决问题,如若不行,那就只有更换内存条了
常见故障四:随机性死机
此类故障一般是由于采用了几种不同芯片的内存条,由于各内存条速度不同产生一个时间差从而导致死机,对此可以在CMOS设置内降低内存速度予以解决,否则,唯有使用同型号内存。还有一种可能就是内存条与主板不兼容,此类现象一般少见,另外也有可能是内存条与主板接触不良引起电脑随机性死机。
常见故障五:内存加大后系统资源反而降低
此类现象一般是由于主板与内存不兼容引起,常见于高频率的内存内存条用于某些不支持此频率的内存条的主板上,当出现这样的故障后你可以试着在COMS中将内存的速度设置得低一点试试。
常见故障六:运行某些软件时经常出现内存不足的提示
此现象一般是由于系统盘剩余空间不足造成,可以删除一些无用文件,多留一些空间即可,一般保持在300M左右为宜
常见故障七:从硬盘引导安装Windows进行到检测磁盘空间时,系统提示内存不足
此类故障一般是由于用户在config.sys文件中加入了emm386.exe文件,只要将其屏蔽掉即可解决问题
题打个电话也很方便,所以安心做啦
当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决)
一、服务器常见故障分类
二、服务器常见故障现象及其对应排错方法
三、服务器排错基本原则
四、服务器故障需要收集哪些信息
五、服务器硬件故障排错实例
六、服务器软件故障排错实例
七、服务器常见内存故障现象
一、服务器常见故障类型分类:
A.开机无显示
B.加电BIOS自检阶段故障
C.系统和软件安装阶段故障和现象
D.操作系统启动失败
E.系统运行阶段故障
二、服务器常见故障现象及其对应的排除方法
A.服务器开机无显示(加电无显示和不加电无显示)
1.检查供电环境
2.检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。)
3.按下电源开关时,键盘指示灯是否亮、风扇是否全部转动
4.是否更换过显示器,尝试更换另外一台显示器
5.插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试
6.是否添加了CPU,如果有增加CPU尝试去掉
7.去掉增加的第三方I/O卡包括Raid卡等
8.ClearCMOS(记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服)
9.尝试更换主板、内存等主要部件
10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下
B.加电BIOS自检报错
1.根据BIOS自检报错信息提示
2.查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启
3.做最小化测试
4.尝试清除CMOS
5.看能否正常进入BIOS
C.系统安装阶段故障和现象
1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表)
2.系统安装蓝屏(对蓝屏故障代码诊断)
3.安装在分区格式化的时候找不到硬盘
(阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装)
4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡)
(使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可)
5.安装过程是死机
(检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝试最小化配置安装检查是否为内存和CPU等问题)
6.引导光盘安装失败
(使用引导光盘安装失败,查看引导光盘版本是否匹配,尝试手动安装系统,如有阵列重新配置阵列引导安装)
D.操作系统启动失败
1.在系统启动自检过程中有报错(具体查看启动报错信息在定方案)
2.启动系统蓝屏(查看蓝屏代码核对)
3.进入登陆界面死机(查看进入单用户或者安全模式是否正常,进入BIOS是否正常、是否会死机,进入磁盘阵列查看阵列状态是否正常,检查测试硬盘是否有坏道,最小化配置启动)
4.忘记密码 (windows使用PE破解,linux进入单用户破解)
E.系统运行阶段故障
1.安装数据库等应用软件报错(对系统版本和软件版本是否兼容,查看报错信息是否缺少插件)
2.系统运行速度变慢(查杀病毒,检测阵列状态,测试硬盘有无坏道,重新安装系统或者修复)
3.运行蓝屏(查看蓝屏代码目录)
4.运行死机(检查进入BIOS是否死机,进入系统后测试部件温度是否正常,windows系统查看dump文件)
5.硬盘拷贝数据文件速度变慢 (测试硬盘是否有坏道,如果有阵列检查阵列状态,检查改变条带大小,与软件应用要求测试对比)
三.服务器故障排错的基本原则:
1.尽量恢复系统出厂配置
a:硬件配置:去除第三方厂商备件和非标配备件
b:资源配置:清除CMOS、恢复资源初始配置
c: BIOS、F/W、驱动程序:升级最新的BIOS、F/W和相关驱动程序
d: TPL:扩展的第三方的I/O卡是否属于该机型的硬件兼容列表(TPL)
2.从基本到复杂
a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。
b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。
c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。
3.部件交换对比测试
a:在最大可能相同的条件下,交换操作简单效果明显的部件
b:交换NOS载体,既交换软件环境
c:交换硬件,既交换硬件环境
d:交换整机,既交换整体环境
在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。一般来说不可能一次就可以准确地判断出问题的所在。这样就要求工程师要有信心和耐心。出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。总之,服务器出错后必须一步一步解决,没有捷径可言。
四、服务器故障排除需要收集哪些信息
1.服务器信息:
①.机器型号:什么厂家的机器、什么型号如:DELL R720服务器
②.机器序列号或主机编号(如:主机编号为NC)
③.是否增加其它设备,如网卡、Raid卡、内存、CPU等
④.硬盘配置,如是否做磁盘阵列,阵列级别
⑤.安装什么操作系统及版本(win2003、Redhat等)
⑥.在故障前有没有做过操作、或者运行了什么软件
⑦. BIOS版本
2.故障信息:
①.在POST自检时,屏幕显示的异常信息
②.服务器本身指示灯的状态
③.报警声和BEEP CODES
④.系统的事件记录文件
⑤. Sel日志
五、服务器硬件故障处理实际案例(因厂家机型不同,在实际问题中如果遇到相似现象,也需要具体问题具体分析,请不要盲目套用)硬件故障是指服务器硬件出现异常而导致的各类错误,由于服务器构成比较复杂,因此在检查的时候必须认真、仔细。
有一台XXX型号服务器,配有256M内存,使用一个PIIIXEON 500带2M高速缓存的处理器。
开机后没有任何显示,但系统日志上提示了一条CPU电压为0伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明)。这种错误一般是处理器电压调节模块(VRM)出错或CPU出错或CPU与CPU板块接触不良,但也可能是CPU板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。
因为CPU板块在整个服务器中,占有举足轻重的地位,如果它出错服务器是会报致命错误的,并且在系统日志中会提示致命错误,但报CPU电压报错的情况也有5%左右。我们立刻把CPU调换在另一CPU插槽中,开机后依然是刚才的那种故障。所以在初步判断中,可以排除是CPU板块坏。这时取出CPU仔细擦拭金手指,以及CPU板块中与CPU接触的地方后,开机依然无显示。相对处理器坏的情况来说处理器电压模块(VRM)出现故障的情况比较大。于是立即在另一台同型号服务器中取下一个处理器电压模块,安装在此服务器中。开机后,服务器依然没有任何显示,系统日志上依然提示CPU电压为0伏的信息,系统指示灯三灯依然不停在闪烁。这时的情况就比较明显了。于是立即从另一台同类型服务器中取下一个CPU安装后,开机正常。
有一台XXX型号服务器不显示,发现开机时系统日志没有任何信息,且系统指示灯不亮。初步判断是电源方面出现了错误。经过仔细检查,发现服务器的电源是正常的,因此最大的可能就是服务器的电源管理板出现故障。更换电源管理板后,开机显示正常。但这时,新的问题来了:自检时,用CTRL+M不能检测到硬盘。
硬盘在别的服务器上是正常的,因此立即清除此服务器的CMOS,但依然不正常。立刻上网找到此服务器的最新BIOS,升级BIOS后也不能解决问题。又检查硬盘笼子和服务器里的数据线及电源线后依然出错。这时,一般情况会怀疑是服务器的I/O板(输入输出板块)有问题。但就在这个时候,工程师发现在I/O板上有一个非XXX型号服务器标配的旧式网卡,立即去除此网卡后服务器就一切正常。
硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需要各部件之间的大力协调。建议大家在采购各元件时,都采用同一品牌原装的,并且要采用能发挥服务器性能的元件(上例中的旧式网卡即使正常也会严重影响服务器性能),这样才不会发生莫明其妙的故障。
用户需要把他的XXX型号服务器升级到双网卡,我建议他购买原装网卡,但当他看到XXX型号服务器的网卡是采用的INTEL 82559芯片后,断然决定不使用原装网卡而采用另一品牌也采用INTEL82559的网卡。过了几天,他打电话给我说,他的新网卡不能使用网络冗余及数据校验,并怀疑服务器有问题。工程师带了一个INTEL 82559网卡到用户那里,仔细检查了服务器的环境完全正常后,把INTEL82559网卡安装到机器上后一切正常。这个例子更加说明了,要发挥服务器的最大性能及功能,必须使用原品牌原装的配件。非原品牌非原装的配件,不能支持服务器的某些功能,严重的会影响到服务器的正常使用。
要避免硬件故障发生频率,服务器管理人员必须注意服务器的使用环境完全正常。比较重要的服务器必须在恒温、恒湿的环境;电压也要符合,不仅要采用UPS,还必须接地线,必须是左零线、右火线,零地电压在1~3伏。在开、关服务器上必须符合正常的流程。工作人员必须严格执行操作流程。
服务器故障现象:
一台XXX型号服务器,近期频繁出现几次蓝屏幕死机故障。趁死机关闭的机会,
将内存由原来的128M升级到512M(普通内存),并且在系统CMOS设置中选择装入(Load)最优参数设置,对内存每个单元进行检测。怪异服务器故障出现了,当我开机后,内存检测正常,但是屏幕提示须重新SETUP,按指定的[F2]键后却死机。我装个内存条招谁惹谁了,怎么会死机?而且内存检测正常啊?
服务器故障处理:
服务器出了故障就要解决,哪怕是怪异服务器故障。按照缩小故障源的思路,换回原来的内存条,逐步去掉各个部分(软驱、硬盘、光驱等),可是这个怪异服务器故障依然存在。分析可能与系统SETUP设置有关,特别是关于对内存每个单元进行检测的设置。于是,拔出电池,对电池插脚短接放电,没有奏效。看来,这个怪异服务器故障还真是顽固。后来,找到主板清除CMOS跳线设置,将插脚线由1-2改到2-3一会儿,然后恢复原位,开机正常(提示:不要轻易拔出电池,而是要找CMOS清除跳线)。再次将内存升级,调整CMOS SETUP设置,特别注意到对内存的检测,设置为检测到每兆,至此系统完全恢复正常。
服务器故障经验
这个怪异服务器故障发生的根本原因是服务器的内存缺省设置为ECC(带校验),由于使用普通不带校验的内存,而系统中设置每个单元都进行检测,所以导致了上面的故障。排除的方法是清除CMOS设置,调整有关参数设置。另外CMOSSETUP装入最优参数设置通常有2种:一种是BIOS优化参数,这种参数稳定性最好;另一种是SETUP优化参数,优化整个系统,但是需要系统支持,其稳定性不能保证最好。所以,当系统出现故障时,不妨先将稳定性最好的参数装入,解决问题后再行
一台XXX型号服务器使用8708E的raid卡在读取某个文件或运行某个软件时经常出错,或者要经过很长时间才能成功,其间硬盘不断读盘并发出刺耳的杂音,这种现象意味着硬盘上载有数据的某些扇区已坏。
一旦硬盘有比较刺耳的杂音可以尝试使用HD软件来测试硬盘时候有坏道,进入ctrl+H配置界面进行查看,阵列是否降级
六、服务器常见软故障解决思路与实例
服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。
下面分别举例说明各类软件故障的维修方法。
有一台XXX型号服务器,配置为双PIII500带521K高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module(VRM) over/under-voltage 2.88V/0V”。从表面来看,极有可能是服务器的电压调节模块或其它硬件出现故障,极容易导致维护人员认为是硬件故障。维护人员立刻使用其它同类型服务器的硬件来测试,发现即使使用新的配件,此服务器依然报VRM错。就在一筹莫展的时候,维修工程师带来了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升级了CPU管理板块的FIRMWARE后,服务器恢复立即正常。
FIRMWARE升级方法是每个厂家的服务器都有专门的firmware升级方法和软件,以联想为例,一般需要使用PE或dos环境下使用专门的升级软件来使用,任何一款服务器的FIRMWARE及BIOS都会有不同的BUG,因为BUG在所难免,所以我们不能错误地认为服务器的BIOS程序就很完善,最新的不是一定是最好的最稳定的才是最好的,在升级之前应该小心谨慎,升级了错误的版本和使用错误的步骤会导致机器彻底的黑屏和瘫痪。
目前流行的中高档服务器都拥有强大的管理程序,为客户提供了方便的管理途径;服务器也拥有各种操作系统下的驱动程序,方便了客户在各种操作系统中的使用。但是,世上任何一款程序都会有一些BUG,这些BUG将影响用户使用。但是服务器厂商总是会在第一时间内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。
当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序BUG会导致系统速度变慢,CPU占用率变高,无法正常使用某些功能等;驱动程序的BUG会导致死机、与某些软件有冲突,磁盘工作不稳定等。查看管理程序是否出错的最好的办法就是在系统中首先禁止此类管理工具,再观察服务器是否还是异常。由于管理工具是随着系统启动而启动的,所以应首先避免它的启动。以WINDOWS NT4为例,就首先在管理工具服务中禁用某些服务器软件服务,再修改注册表中的启动项即可。如果是驱动程序有问题的话,就以安全模式进入系统,看是否正常。但是需要注意的是,在安全模式中,系统速度变慢是正常的(特别是磁盘I/O方面)。
服务器的维护人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。相比之下,软件冲突造成的故障判断比较困难,需要管理人员有比较丰富的经验以及敏锐的观察力。
一位用户说,他有一台XXX型号服务器无法安装SQL SERVER 2000,已经重装N次NT了,排除是系统故障。而这唯一的服务器又将作为非常重要数据库服务器,因此非常着急。于是维修工程师去了他的公司查看。这台服务器所在的机房是非常标准、完善的机房,检查了这台服务器的情况,发现并没有硬件上的故障,于是排除了光驱读盘力差的可能。
但是,用户刻的SQL SERVER 2000光盘引起了工程师的怀疑,工程师让他拿出了正版的SQL SERVER安装,结果还是不行。在安装的过程中,没有出现丝毫错误,可就是在运行的时候会自动退出,没有任何提示。但是,我在管理工具中的事件查看器的系统日志中却发现了一条信息:windata.exe导致一个无效的数据溢出。Windata是用户自己编写的一个程序,而且是随操作系统启动而启动的程序。立即结束掉这个进程后,再运行SQL一切正常。
对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。
还有一种软件故障是人为因素造成的,它一般是人为误操作(包括没按操作流程的操作)、意外关机(包括电源突然不供电)或非正常关闭应用程序造成的。
人为误操作因素只要加强管理都可以避免此类故障发生。在这里就详细说明意外关机或非正常关闭程序造成故障的方法。正常关闭系统程序非常重要,尤其是WEB服务器,一个用户就是因为没有正常关闭系统程序而经历了一次数据损坏甚至丢失的经历。
七、服务器常见内存故障现象实例
服务器常用部件除了硬盘以外就是内存了,内存为服务器主要部件以个人经验来讲它一旦出现问题不是很好来判定,因为服务器一般来讲都会由阵列功能的,一旦硬盘故障硬盘前面板会有指示灯,没有指示灯的在阵列的配置界面里面也会看到有降级或者硬盘离线的报错信息的。实在不行我们还有很多像HD等硬盘检测工具来给我们现场使用。但是内存不是很好来观察只能通过一些经验现象来判定。下面列出一些内存常见问题现象供大家参考。
常见故障一:开机无显示
内存条原因出现此类故障一般是因为内存条与主板内存插槽接触不良造成,只要用橡皮擦来回擦试其金手指部位即可解决问题(不要用酒精等清洗),还有就是内存损坏或主板内存槽有问题也会造成此类故障。由于内存条原因造成开机无显示故障,主机扬声器一般都会长时间蜂鸣(针对Award Bios而言)。
常见故障二:Windows注册表经常无故损坏,提示要求用户恢复
此类故障一般都是因为内存条质量不佳引起,很难予以修复,唯有更换一途。
常见故障三:Windows经常自动进入安全模式
此类故障一般是由于主板与内存条不兼容或内存条质量不佳引起,常见于高频率的内存用于某些不支持此频率内存条的主板上,可以尝试在CMOS设置内降低内存读取速度看能否解决问题,如若不行,那就只有更换内存条了
常见故障四:随机性死机
此类故障一般是由于采用了几种不同芯片的内存条,由于各内存条速度不同产生一个时间差从而导致死机,对此可以在CMOS设置内降低内存速度予以解决,否则,唯有使用同型号内存。还有一种可能就是内存条与主板不兼容,此类现象一般少见,另外也有可能是内存条与主板接触不良引起电脑随机性死机。
常见故障五:内存加大后系统资源反而降低
此类现象一般是由于主板与内存不兼容引起,常见于高频率的内存内存条用于某些不支持此频率的内存条的主板上,当出现这样的故障后你可以试着在COMS中将内存的速度设置得低一点试试。
常见故障六:运行某些软件时经常出现内存不足的提示
此现象一般是由于系统盘剩余空间不足造成,可以删除一些无用文件,多留一些空间即可,一般保持在300M左右为宜
常见故障七:从硬盘引导安装Windows进行到检测磁盘空间时,系统提示内存不足
此类故障一般是由于用户在config.sys文件中加入了emm386.exe文件,只要将其屏蔽掉即可解决问题
以上就是贤集网小编为您介绍的相关内容,如果您有什么想法,欢迎到下方评论留言。
我来说几句
还没有人评论哦,抢沙发吧~
大家都爱看
专题资讯导航
意见被贤集网采纳后,贤集网赠送一张限量版的U盘会员卡!
联系方式(必填)
您的意见(必填)
Copyright (C)2014

我要回帖

更多关于 U盘装原版系统 的文章

 

随机推荐