Linux遇到故障不要怕，这10个命令要熟练掌握！-mengmeng

glab-mary的博客

首页　| 　博文目录　| 　关于我

mengmeng_921

博客访问： 3951
博文数量： 31
博客积分： 0
博客等级：民兵
技术积分： 325
用户组：普通用户
注册时间： 2018-03-18 14:10

个人简介

10+从业经验，3CCIE、HCIE、红帽RHCA、VCP。获取Linux资料，可+v：glab-mary

文章分类

全部博文（31）

Linux命令大全（10）
未分配的博文（21）

文章存档

2025年（14）

2024年（17）

我的朋友

1. dmesg

查看内核消息，排查硬件故障

dmesg（diagnostic message）是一个非常强大的命令，用于查看内核的启动信息和系统事件。它显示的是内核环节的日志，通常用于硬件相关问题的排查。当系统无法识别某个设备，或者出现设备挂载失败的情况时，dmesg通常是你首先需要检查的命令。

? 排查硬件设备问题，如USB设备、磁盘或网络接口。
? 分析系统启动过程中的错误。

dmesg | tail -n 20

该命令将返回dmesg输出的{BANNED}最佳后20行日志，帮助你快速查看系统的{BANNED}最佳新错误信息。

如果你需要查看特定设备或模块的日志，可以结合grep进行过滤：

dmesg | grep BUS

这会过滤出所有与BUS设备相关的内核消息，帮助你找到是否有BUS设备识别失败或驱动加载错误的情况。

2. journalctl

系统日志全览，定位服务崩溃

journalctl是一个用于访问和查看由systemd管理的系统日志的工具。它可以帮助你查看详细的系统事件日志，尤其是在系统崩溃或服务启动失败时，日志内容非常关键。通过journalctl，你可以访问整个系统的事件信息，包括内核、服务、应用程序等的输出。

? 调查系统崩溃的根本原因。
? 查看服务启动失败或出现异常的详细日志。

journalctl -xe

这个命令将列出{BANNED}最佳近的日志信息，并自动过滤出带有“错误”级别（例如警告、错误等）的日志。它通常用于快速定位服务崩溃或系统故障的原因。

你还可以通过指定具体服务来查看日志：

journalctl -u nginx.service

这将显示与nginx服务相关的所有日志，帮助你发现该服务出现问题的详细信息。

3. htop：

实时监控系统资源，找出耗费资源的进程

htop是top命令的增强版本，提供了更友好、直观的界面，能够实时监控系统的CPU、内存使用情况，并展示所有运行的进程信息。它支持交互操作，你可以直接在界面中进行排序、过滤，甚至杀死进程。

? 实时监控系统资源使用情况，定位性能瓶颈。
? 识别高CPU或内存使用的进程。

只需要运行：

htop

你将看到一个彩色的动态界面，显示系统当前的资源使用情况。通过键盘上的方向键，你可以快速查看各个进程的资源消耗情况。你还可以使用F6键按CPU、内存等字段进行排序，帮助你快速找到占用资源{BANNED}最佳多的进程。

4. ps aux

查看所有正在运行的进程

ps aux命令列出当前系统上所有正在运行的进程，并显示相关的详细信息，包括进程ID（PID）、CPU和内存使用量等。ps命令非常适合用来核实服务是否启动，或者识别哪些进程可能导致系统卡顿或资源消耗过高。

? 查看系统上正在运行的所有进程。
? 查找并终止占用大量资源的进程。

ps aux | grep nginx

这条命令会过滤出与nginx相关的所有进程。如果你的nginx服务无法启动，或者你想确认是否运行，你可以通过ps aux命令来查找它的进程。

5. strace

追踪系统调用，帮助调试进程

strace是一个强大的调试工具，可以追踪进程执行时的所有系统调用（如文件操作、网络请求、内存分配等）。通过分析这些调用，您可以了解程序在执行过程中遇到的问题，并快速定位崩溃或卡顿的原因。

? 调试应用程序崩溃或挂起问题。
? 分析进程在执行时的系统调用和IO操作。

strace -p

通过将strace附加到进程的PID上，你可以看到该进程执行时的所有系统调用。例如，若一个进程挂起无法结束，strace可以帮助你追踪到具体出问题的地方。

6. lsof

查看打开的文件和网络连接

lsof（List Open Files）命令可以列出当前系统上所有打开的文件和网络连接。它对于解决文件锁、网络连接挂起或进程无法退出等问题非常有用。

? 查看哪些文件或端口被哪些进程占用。
? 解决进程无法正常关闭或文件被锁定的情况。

lsof -i

这个命令将列出当前所有打开的网络连接和监听端口，帮助你识别网络故障或端口冲突等问题。

7. ping

测试网络连通性

ping命令是一个非常基础但重要的网络诊断工具，用于测试本地系统和远程主机之间的网络连通性。它通过发送ICMP请求包并等待响应，帮助你确认网络是否正常工作。

? 检查网络是否正常，是否可以访问外部主机。
? 诊断DNS问题，确认域名是否解析正确。

ping -c 4 baidu.com

该命令将发送4个ICMP包到baidu.com并显示响应时间。如果没有响应，说明网络或DNS可能存在问题。

8. ss

查看网络连接和套接字状态

ss是比netstat更强大、更高效的网络工具，用于查看当前的网络连接、监听端口、套接字状态等。它提供了比netstat更多的详细信息，帮助你深入分析网络问题。

? 排查网络连接、端口占用等问题。
? 查看TCP、UDP连接的详细信息。

ss -lnt

该命令会列出所有正在监听的TCP端口，帮助你发现哪些服务正在占用系统的端口。

9. df

查看磁盘空间使用情况

df命令用于显示文件系统的磁盘空间使用情况，帮助你判断磁盘空间是否不足。磁盘空间不足往往是导致系统性能下降或应用程序崩溃的原因之一。

? 检查磁盘空间，确保系统没有因磁盘满而出现问题。

df -h

该命令会以人类可读的格式显示磁盘的使用情况，如GB、MB等单位，帮助你快速识别哪些分区的空间使用过高。

10. uptime

查看系统负载情况

uptime命令非常简洁，但它提供了非常有用的信息：系统的运行时间，以及过去1分钟、5分钟和15分钟的负载平均值。通过这些数据，你可以判断系统是否过载，或者是否需要进行性能优化。

? 判断系统是否过载，评估是否需要扩展硬件资源。

uptime

你将看到类似如下的输出：

通过负载平均值，你可以直观了解系统的负载情况。如果负载平均值较高，说明系统可能正处于过载状态，处理能力不足，需要优化或增加资源。

总结

? dmesg 让你能查看内核消息和硬件错误。
? journalctl 提供详细的系统日志，帮助你追踪服务崩溃的原因。
? htop 实时监控系统资源，找出导致系统卡顿的进程。
? ps aux 查看当前系统的所有进程，帮助你判断哪些进程占用了过多资源。
? strace 追踪进程的系统调用，帮助你找到程序崩溃的根本原因。
? lsof 查看系统中打开的文件和网络连接，帮助你解决文件锁定和网络连接问题。
? ping 检查网络连接是否正常。
? ss 查看详细的网络连接信息，帮助你排查网络问题。
? df 查看磁盘空间使用情况，确保系统不因磁盘满而崩溃。
? uptime 查看系统负载，判断系统是否过载。

无论是调试程序、分析系统资源，还是检查网络连接或存储空间，这些命令都将成为你在Linux系统中故障排除的强大武器。掌握它们，将让你在面对Linux系统问题时更加游刃有余，轻松应对各种挑战。

阅读(43) | 评论(0) | 转发(0) |

上一篇：Linux 两个查找工具 locate，find，谁是你的最佳选择？

下一篇：到底什么是上下文切换？

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6