ubuntu 에서 계속 “AER: Corrected error received: 0000:00:1d.0” 에러가 나올 때

얼마 전부터 스플래시 스크린이 나온 다음과, 나오기 직전에 계속 에러 메시지가 화면에 떠 있었다. 로그 확인하려고 dmesg 실행해 보면 로그 중간에 저 에러가 드문드문 들어와 있었다.

한번 dmesg 를 실행해 보면…

gerd@SweetBoxx:~$ dmesg

……

[ 279.689855] pcieport 0000:00:1d.0: AER: Corrected error received: 0000:00:1d.0
[ 279.689871] pcieport 0000:00:1d.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[ 279.689879] pcieport 0000:00:1d.0: device [8086:9d18] error status/mask=00000001/00000000
[ 279.689885] pcieport 0000:00:1d.0: [ 0] RxErr
[ 296.206366] EXT4-fs (sdb1): mounted filesystem with ordered data mode. Opts: (null)
[ 620.039823] pcieport 0000:00:1d.0: AER: Multiple Corrected error received: 0000:00:1d.0
[ 620.039980] pcieport 0000:00:1d.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[ 620.039989] pcieport 0000:00:1d.0: device [8086:9d18] error status/mask=00000041/00000000
[ 620.039994] pcieport 0000:00:1d.0: [ 0] RxErr
[ 620.039998] pcieport 0000:00:1d.0: [ 6] BadTLP
[ 688.162790] pcieport 0000:00:1d.0: AER: Corrected error received: 0000:00:1d.0
[ 688.162796] pcieport 0000:00:1d.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
[ 688.162800] pcieport 0000:00:1d.0: device [8086:9d18] error status/mask=00000001/00000000
[ 688.162803] pcieport 0000:00:1d.0: [ 0] RxErr
…..

gerd@SweetBoxx:~$

AER 에서 내는 에러가 저런 식으로 무쟈게 찍혀있다. AER 이 뭔가 검색해보니, Advanced Error Reporting – 줄여서 AER – 이라고 하고, PCIe 를 감시하고 에러가 있으면 보고해 주는 기능이라고 한다.

 몇몇 사이트에서는 AER 을 끄는 것을 해결책으로 제시하고 있었다. 커널 부트 옵션에 “PCI=noaer” 을 삽입하면 된다고 한다.

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pci=noaer"

이렇게 해 두면 당장 에러 메시지는 나오지 않았지만, 아무래도 찜찜해서 좀 더 검색을 해 봤다. 그러다 발견한 아래 사이트에서 제대로 된 답변과 해결책을 얻을 수 있었다.

https://unix.stackexchange.com/questions/327730/what-causes-this-pcieport-00000003-0-pcie-bus-error-aer-bad-tlp

요약하면 CPU 와 PCIe 버스 컨트롤러는 트랜잭션 계층 패킷(TLP)으로 통신한다고 한다. 그 때, 더 빠르고 편리한 통신을 위해서 메모리의 일부를 매핑하여 I/O 용으로 사용하는데, 이 때 문제가 생기는 것이라고 한다. 그래서 pci=nommconf 옵션을 사용해서 원래의 I/O 포트를 이용하게 하면 위 문제가 해결된다고 한다.

커널 옵션을 추가하는 방법은 바로 이전의 포스트에서 한번 설명했다. 요약하면 /etc/default/grub 파일을 열어 옵션을 추가하고, update-grub 명령으로 업데이트 하면 된다.

GRUB_DEFAULT=0
GRUB_TIMEOUT=0
GRUB_DISTRIBUTOR=`lsb_release -i -s 2> /dev/null || echo Debian`
GRUB_CMDLINE_LINUX_DEFAULT=”quiet splash”
GRUB_CMDLINE_LINUX=”mitigations=auto,nosmt pci=nommconf

재부팅하면 관련 에러 메시지가 싹 사라진다.

기분 탓인지는 모르겠지만, 시스템이 살짝살짝 멈칫하던 느낌도 없어졌다.


참고사이트

https://askubuntu.com/questions/1104219/what-does-pci-noaer-or-pci-nomsi-mean

https://h30434.www3.hp.com/t5/Notebook-Software-and-How-To-Questions/Error-Spam-AER-id-00e5-PCIe-Bus-Error-severity-Corrected/td-p/5933687

https://unix.stackexchange.com/questions/327730/what-causes-this-pcieport-00000003-0-pcie-bus-error-aer-bad-tlp

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

This site uses Akismet to reduce spam. Learn how your comment data is processed.