四,服务器故障排查方法总结
问题描述:
每当出现网站访问不了的时候,估计应该就是服务器出现故障了,这个时候大部分情况都是属于数据库出现问题。
查找步骤:
1、查找top检查服务器负载是否有问题
一般网站访问不了,top显示的负载都是很大的,这个时候可以看到mysql的进程占用资源很高,往往就是mysql发生故障了
2、在服务器中查看网站的访问记录
这些访问记录存储在:/home/对应的网站名/access-logs/对应的网站名
可以先通过tail查看,查看出异常的ip的时候可以通过grep进行过滤查看,在这个文件一般都可以找到恶意爬虫、恶意访问的记录,这些往往有可能是导致mysql数据库挂掉的原因。
3、这个时候先对数据库进行重启,对Apache进行重启
service mysql restart
service httpd restart
重启之后一般都可以暂时恢复正常的访问的了。 如果是出于恶意访问的话,找出恶意访问的ip把它禁止掉即可,如果是网站数据库出现故障,那么还要进行数据库排查。
4、查找数据库错误日志
首先需要知道数据库mysql的安装目录,可以通过whereis mysql找到,但是这往往没用
还有一种方法,就是通过ps -ef | grep mysql来查看
或者也可以通过进入mysql,使用select @@basedir as basePath from dual来查看mysql安装目录
我们在第二种查找方法ps -ef | grep mysql中对应mysql的几种日志找到其所在目录,然后查看对应文件进行分析
mysql有以下几种日志
错误日志:-log-err
查询日志:-log
慢查询日志:-log-slow-queries
更新日志:-log-update
二进制日志:-log-bin
以上便是对应的数据库错误日志和慢查询日志的查看方法了
在服务器的维修中,线索都会显得扑朔迷离,有的甚至按起葫芦翘起瓢。 一般来说不可能一次就可以准确地判断出问题的所在。 这样就要求工程师要有信心和耐心。 出现错误一般的方法都是根据经验优先使用最简单排错方法测试,如果没有解决问题再找其它因素进行测试。 总之,服务器出错后必须一步一步解决,没有捷径可言。
单击“重试”,要是你的网络通的话就可以上了, 要是不通的话就按下面的方法吧!1.“自动化”的网络诊断依次点击“开始→程序→附件→系统工具→系统信息”,在打开的“ 系统信息”窗口中点击“工具→网络诊断”,随后进入“ 帮助和支持中心”的网络诊断运行窗口,点击“扫描您的系统”后, 网络诊断工具将开始对整个网络进行诊断。 在这个过程中,系统将调用Ping等命令对网关、 DNS服务器等进行探测和查错。 此过程完成后, 展开所有标有红色“失败”的项, 即可快速诊断出故障的所在之处了(图1)。 图12.TCP/IP故障诊断工具IPConfig通过IPConfig提供的信息,可以确定存在于TCP/ IP属性中的一些配置上的问题。 例如使用“IPConfig /all”就可以获取主机的详细的配置信息,其中包括IP地址、 子网掩码和默认网关、DNS服务器等信息。 通过所获知的信息,可以迅速判断出网络的故障所在。 例如子网掩码为0.0.0.0时, 则表示局域网中的IP地址可能有重复的现象存在; 如果返回的本地IP地址显示为169.254.*.*, 子网掩码为255.255.0.0, 则表示该IP地址是由Windows XP的自动专用IP寻址功能分配的。 这意味着TCP/ IP未能找到DHCP服务器, 或是没有找到用于网络接口的默认网关。 如果返回的本地IP地址显示为0.0.0.0, 则既可能是DHCP初始化失败导致IP地址无法分配, 也可能是因为网卡检测到缺少网络连接或TCP/ IP检测到IP地址有冲突而导致的。 3.连接故障诊断工具Ping大家可能对Ping命令非常熟悉, 关于Ping的种种应用也非常多, 这里e博士只谈一下通过Ping命令探测远程IP地址和域名来检 查连接故障的方法。 假设使用Ping域名的方式失败了, 但Ping IP的方式却成功了,那么问题显然是出在主机名称解析服务上, 此时就应该检查本机TCP/ IP属性中设置的DNS服务器是否能够正常解析。 4.“网络路径”诊断工具TracertTracert可以帮助我们确定网络中从一台主机到另一台主机的 路径(包括路由器和网关)。 通过Tracert反馈的消息, 我们可以初步判定故障所在的位置。 假设A科室到车间的网络不通, 我们就可使用“Tracert 车间IP”命令来检查故障的位置, 当看到反馈信息中有排成一行的三个星号则表示通信到此失败, 那么就可以派人到故障位置检查线路和设备。 微恙自疗在网络应用中,常常会遇到一些令人心烦的小毛病, 如网络时通时断、只能上QQ却不能打开网页等。 通过前面的“ 诊断”得出结果后,你是愿意等高手来排除故障, 还是愿意自己动手使用一些“速效”办法来应急“自疗”呢? 一般情况下,你还是想自行排除故障吧。 1.“修复”功能“修复”功能采用了一种“批处理”的方式,在每次执行该功能时, 系统会自动调用内置的近十条网络修复命令, 从多个方面帮助用户解决网络故障。 在“本地连接” 的右键快捷菜单中可以看到它的存在(图2)。 图2这个功能可以让网络重新进行DHCP动态IP的分配、 可以刷新地址解析协议和NetBIOS名称等缓存。 这个并不起眼的“修复”功能免去了我们手工输入“ ipconfig /renew”、“arp –d”、“nbtstat –R”、“nbtstat –RR”、“ipconfig /flushdns”等诸多命令的麻烦, 能够帮助我们极快地解决很多网络中的轻微故障。 2.暂停服务在Windows XP中,很多系统服务都与网络有着密切的联系, 如果你在进行了一些设置后发现网络出现不稳定的现象, 不妨先将相关的服务暂时关闭,看看是否能够解决问题。 如使用IPSec技术可以提高网络的安全性,这是众所周知的。 但在某些情况下,IPSec策略会要求网络通信采用“安全模式” ,这个要求可能会使一些网络连接变得不稳定。 所以, 在设置了IPSec策略后网络不稳定时,不妨先在“运行” 栏中输入“”命令打开“服务”窗口, 将列表中的“IPSEC”服务暂时关闭, 看看故障是否可以得到解决。 如果停止IPSec服务后问题消失, 说明故障是IPSec的部分策略导致的, 在故障的大概范围确定下来后,再进行顺藤摸瓜式的故障排除即可, 如逐个检查或停用可疑的IPSec策略, 观察它们是否存在设置上的问题。 重症猛药重症需要猛药治,对于网络中的一些使用“速效法” 也无济于事的顽疾,要想彻底根治,就要从根本上解决问题。 如一些因系统本身 设计 上的缺陷导致的故障,必须要用“打补丁”的方法来解决, 而那些因混乱不堪的协议设置导致的故障, 则需要重装协议方可彻底解决。 1.修修补补很多想尽办法也难以解决的网络故障, 往往都是系统本身设计的缺陷所导致的, 针对这种情况我们要做的事情只有一件——下载补丁程序进行修补。 微软 的帮助与支持网址是“/default. asp x”,在该网站,我们可以下载到包括Windows XP SP2在内的所有Windows产品的补丁。 2.重装协议对于一些明显是因为网络协议安装、配置不正确导致的故障, 重装协议也许就是最好的办法了。 在Windows 98中可以通过在“网上邻居” 的属性窗口中删除网卡的方法来重装所有的协议和服务; 在Windows 2000/XP/2003中使用“Netsh int ip reset c:\”命令,可让TCP/ IP协议恢复初始的状态(未进行任何设置), 接着再重新进行设置即可。 网络故障多种多样,但并非无规律可循,随着经验的不断丰富, 大家排除网络故障的能力将会越来越高。 希望本期e博士介绍的网络故障排除思路和方法, 能够成为大家预防、排除网络故障的得力助手, 能够提高大家对网络的管理、维护能力记得采纳啊
网站崩溃是研发团队面临的常见问题,作为测试人员,了解网站崩溃的原因及排查方法对测试工作至关重要。 本文将详细介绍12种常见的网站崩溃原因以及相应的排查与解决策略。 什么是网站崩溃?简而言之,当网站停止正常工作并阻止用户访问时,即发生了网站崩溃。 浏览器无法处理服务器发送的所有数据,尤其是当服务器资源出现技术故障或错误时,浏览器将停止进一步处理,导致网站崩溃。 网络中断、网络延迟、防火墙屏蔽等基础网络问题可能导致网站崩溃,解决方法包括检查网络连接确保DNS解析正常,检查防火墙设置确保没有误屏蔽。 第三方服务问题也可能引发网站崩溃,解决策略包括检查第三方服务状态,查看服务提供商通知,考虑备用方案或降级处理。 当网站流量过高,超过服务器处理能力时,网站也可能崩溃。 应对策略包括使用负载均衡器、增加服务器容量、使用缓存等措施来处理高流量。 代码错误,如存在错误、未处理的异常、死循环等,可能导致网站崩溃。 解决方法是查看服务器日志、前端日志,修复代码中的错误,确保异常情况得到适当处理。 DNS错误导致网站无法访问,解决方法包括检查域名配置是否正确,刷新本地DNS缓存或更换DNS服务器,检查网络连接,确保DNS记录正确配置。 未加密或未受保护的网站可能遭受黑客攻击导致崩溃。 应使用安全工具监测和防御攻击,及时更新安全策略,修复潜在漏洞。 服务器硬件故障、内存不足、磁盘空间不足等问题可能导致网站崩溃。 解决方法是检查服务器硬件状态,确保足够内存和磁盘空间,必要时重启服务器,进一步调查原因。 被网络列入黑名单可能导致网站无法搜索到,解决方法是咨询开发人员和IT部门,清理恶意软件或违规内容。 云提供商停机时间可能导致网站崩溃。 应联系网络托管服务提供商,确保问题来自他们,如有备份,可考虑在云服务商解决问题之前使用备份进行快速恢复。 人为错误,无论是疏忽、无知、缺乏经验还是简单意外错误,都会影响网站性能。 预防策略是通过记录所有程序使维护和要求尽可能系统化,利用软件集成和自动化减少错误。 缓存问题,如缓存失效、设置不当,可能导致网站崩溃。 解决方法是检查缓存设置,确保合理使用缓存,及时更新缓存。 数据库问题,包括数据库连接问题、查询性能问题、死锁等,也可能导致网站崩溃。 解决策略是检查数据库连接,优化查询语句,监测数据库性能,处理可能的死锁情况。 总结而言,虽然网站崩溃无法完全避免,采取预防措施可以大大减少其发生概率。 一旦网站崩溃,快速找出原因并采取相应措施是关键,以减少损失并确保用户访问体验。
本文地址:http://www.hyyidc.com/article/36915.html