Re: Comment recharger un module noyau planté ?
Le 31/03/22 à 15:55, Daniel Caillibaud a écrit : > Bonjour, > > Ça faisait longtemps que mon module wifi n'avait pas planté, donc pas eu > l'occasion d'essayer > les remèdes. > > Le 14/03/22 à 18:21, Hugues Larrive a écrit : > > Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) : > > echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove > > Cette commande a été assez longue a rendre la main, elle a sorti qqchose dans > kern.log, mais > je n'ai pas cette trace car > > > echo 1 > /sys/bus/pci/rescan > > a complètement planté le système, et après le reboot hard qui a suivi y'avait > plus les traces > précédentes. J'ai eu d'autres plantages, et cette commande a bien fonctionné, ça m'a évité un reboot (j'avais fermé au préalable tout ce qui pouvait consommer du réseau, je sais pas si y'a un rapport). Donc merci Hugues, tu avais raison, c'est bien la carte (ou son firmware) qui se vautre et pas le module noyau. -- Daniel Vaut-il mieux parler bêtement de choses intelligentes ou parler intelligemment de choses bêtes. Philippe Geluck, Le chat
Re: Comment recharger un module noyau planté ?
Bonjour, Ça faisait longtemps que mon module wifi n'avait pas planté, donc pas eu l'occasion d'essayer les remèdes. Le 14/03/22 à 18:21, Hugues Larrive a écrit : > Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) : > echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove Cette commande a été assez longue a rendre la main, elle a sorti qqchose dans kern.log, mais je n'ai pas cette trace car > echo 1 > /sys/bus/pci/rescan a complètement planté le système, et après le reboot hard qui a suivi y'avait plus les traces précédentes. Mar 31 15:26:35 dell kernel: [439827.472935] ath10k_pci :02:00.0: failed to wake target for write32 of 0x11e5 at 0x0003543c: -110 […pas mal de lignes comme la précédente…] Mar 31 15:30:19 dell kernel: [440052.314672] ath10k_pci :02:00.0: failed to wake target for write32 of 0x149f at 0x0003543c: -110 Mar 31 15:30:20 dell kernel: [440053.274771] ath10k_pci :02:00.0: failed to receive scan abortion completion: timed out Mar 31 15:30:20 dell kernel: [440053.274774] ath10k_pci :02:00.0: failed to stop scan: -110 Mar 31 15:30:20 dell kernel: [440053.274776] ath10k_pci :02:00.0: failed to start hw scan: -110 Mar 31 15:30:20 dell kernel: [440053.33] ath10k_pci :02:00.0: failed to wake target for write32 of 0x14a1 at 0x0003543c: -110 […snip…] Mar 31 15:31:16 dell kernel: [440108.635954] ath10k_pci :02:00.0: failed to wake target for write32 of 0x1521 at 0x0003543c: -110 Mar 31 15:31:16 dell kernel: [440108.823493] ath10k_pci :02:00.0: wmi command 20482 timeout, restarting hardware Mar 31 15:31:16 dell kernel: [440108.823503] ath10k_pci :02:00.0: failed to delete WMI vdev 1: -11 Mar 31 15:31:16 dell kernel: [440108.823801] ath10k_pci :02:00.0: failed to set 2g txpower 52: -108 Mar 31 15:31:16 dell kernel: [440108.823803] ath10k_pci :02:00.0: failed to setup tx power 26: -108 Mar 31 15:31:16 dell kernel: [440108.823803] ath10k_pci :02:00.0: failed to recalc tx power: -108 Mar 31 15:31:16 dell kernel: [440108.823810] ath10k_pci :02:00.0: failed to set inactivity time for vdev 0: -108 Mar 31 15:31:16 dell kernel: [440108.823811] ath10k_pci :02:00.0: failed to setup powersave: -108 Mar 31 15:31:16 dell kernel: [440108.823833] wlp2s0: deauthenticating from 7c:8f:de:0b:9f:d7 by local choice (Reason: 3=DEAUTH_LEAVING) Mar 31 15:31:16 dell kernel: [440108.823839] ath10k_pci :02:00.0: failed to set inactivity time for vdev 0: -108 Mar 31 15:31:16 dell kernel: [440108.823842] ath10k_pci :02:00.0: failed to setup powersave: -108 Mar 31 15:31:21 dell kernel: [440113.667374] ath10k_warn: 133 callbacks suppressed Mar 31 15:31:21 dell kernel: [440113.667378] ath10k_pci :02:00.0: failed to wake target for write32 of 0xfffd at 0x00034c10: -110 […snip…] Mar 31 15:31:32 dell kernel: [440125.270874] ath10k_pci :02:00.0: failed to read device register, device is gone Mar 31 15:31:32 dell kernel: [440125.272438] ieee80211 phy0: Hardware restart was requested Mar 31 15:31:32 dell kernel: [440125.272774] [ cut here ] Mar 31 15:31:32 dell kernel: [440125.272776] WARNING: CPU: 1 PID: 254476 at net/mac80211/sta_info.c:1096 __sta_info_destroy_part2+0x130/0x160 [mac80211] Mar 31 15:31:32 dell kernel: [440125.272806] Modules linked in: btrfs(E) blake2b_generic(E) xor(E) raid6_pq(E) zstd_compress(E) ufs(E) qnx4(E) hfsplus(E) hfs(E) minix(E) msdos(E) jfs(E) xfs(E) libcrc32c(E) cpuid (E) loop(E) rfcomm(E) ctr(E) ccm(E) cmac(E) algif_hash(E) algif_skcipher(E) af_alg(E) bnep(E) binfmt_misc(E) mei_hdcp(E) intel_rapl_msr(E) dell_laptop(E) snd_hda_codec_hdmi(E) dell_smm_hwmon(E) btusb(E) btrtl(E) btbcm(E) btintel(E) bluetooth(E) snd_sof_pci_intel_icl(E) snd_ctl_led(E) snd_sof_intel_hda_common(E) soundwire_intel(E) soundwire_generic_allocation(E) soundwire_cadence(E) snd_sof_intel_hda(E) snd_sof_pci(E) s nd_sof_xtensa_dsp(E) x86_pkg_temp_thermal(E) ath10k_pci(E) intel_powerclamp(E) jitterentropy_rng(E) snd_sof(E) coretemp(E) snd_soc_hdac_hda(E) ath10k_core(E) snd_hda_ext_core(E) ath(E) snd_hda_codec_realtek(E) k vm_intel(E) sha512_ssse3(E) snd_soc_acpi_intel_match(E) snd_soc_acpi(E) snd_hda_codec_generic(E) sha512_generic(E) mac80211(E) snd_soc_core(E) kvm(E) snd_compress(E) libarc4(E) irqbypass(E) Mar 31 15:31:32 dell kernel: [440125.272836] soundwire_bus(E) drbg(E) ledtrig_audio(E) nls_ascii(E) ansi_cprng(E) nls_cp437(E) cfg80211(E) rapl(E) snd_hda_intel(E) intel_cstate(E) vfat(E) snd_intel_dspcfg(E) sn d_intel_sdw_acpi(E) fat(E) dell_wmi(E) ecdh_generic(E) intel_uncore(E) pcspkr(E) snd_hda_codec(E) dell_smbios(E) dcdbas(E) serio_raw(E) efi_pstore(E) snd_hda_core(E) uvcvideo(E) snd_hwdep(E) dell_wmi_sysman(E) v ideobuf2_vmalloc(E) firmware_attributes_class(E) snd_pcm(E) videobuf2_memops(E) iTCO_wdt(E) dell_wmi_descriptor(E) videobuf2_v4l2(E) snd_timer(E) intel_pmc_bxt(E) intel_wmi_thunderbolt(E) wmi_bmof(E) videobuf2_c ommon(E) snd(E) iTCO_v
Re: Comment recharger un module noyau planté ?
Le 14/03/22 à 18:21, Hugues Larrive a écrit : > Bonjour, > > Au vu du kern.log, j'ai l'impression que c'est la carte wifi qui plante et > non le module : > Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0: failed > to wake target > for write32 of 0x0579 at 0x0003543c: -110 [plein de failed to wake target] > Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0: failed > to wake target > for read32 at 0x0003a028: -110 Mar 10 10:17:26 dell kernel: [147182.767232] > ath10k_pci > :02:00.0: failed to read device register, device is gone Mar 10 10:17:26 > dell kernel: > [147182.768293] ieee80211 phy0: Hardware restart was requested > > Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) : > echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove > echo 1 > /sys/bus/pci/rescan Merci pour cette piste très intéressante ! Je teste ça au prochain plantage et je vous donnerai le résultat. -- Daniel Un beau livre, c'est celui qui sème à foison les points d'interrogation. Jean Cocteau
Re: Comment recharger un module noyau planté ?
Bonjour, Au vu du kern.log, j'ai l'impression que c'est la carte wifi qui plante et non le module : Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0: failed to wake target for write32 of 0x0579 at 0x0003543c: -110 [plein de failed to wake target] Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0: failed to wake target for read32 at 0x0003a028: -110 Mar 10 10:17:26 dell kernel: [147182.767232] ath10k_pci :02:00.0: failed to read device register, device is gone Mar 10 10:17:26 dell kernel: [147182.768293] ieee80211 phy0: Hardware restart was requested Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) : echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove echo 1 > /sys/bus/pci/rescan Chez moi ça donne ça dans le kern.log : Mar 14 19:09:05 W520 kernel: [3050195.682506] pci :03:00.0: [8086:0085] type 00 class 0x028000 Mar 14 19:09:05 W520 kernel: [3050195.682577] pci :03:00.0: reg 0x10: [mem 0xd520-0xd5201fff 64bit] Mar 14 19:09:05 W520 kernel: [3050195.682836] pci :03:00.0: PME# supported from D0 D3hot D3cold Mar 14 19:09:05 W520 kernel: [3050195.683162] pci :03:00.0: BAR 0: assigned [mem 0xd520-0xd5201fff 64bit] Mar 14 19:09:05 W520 kernel: [3050195.683313] iwlwifi :03:00.0: can't disable ASPM; OS doesn't have ASPM control Mar 14 19:09:05 W520 kernel: [3050195.683936] iwlwifi :03:00.0: firmware: direct-loading firmware iwlwifi-6000g2a-6.ucode Mar 14 19:09:05 W520 kernel: [3050195.684130] iwlwifi :03:00.0: loaded firmware version 18.168.6.1 op_mode iwldvm Mar 14 19:09:05 W520 kernel: [3050195.684146] iwlwifi :03:00.0: CONFIG_IWLWIFI_DEBUG disabled Mar 14 19:09:05 W520 kernel: [3050195.684147] iwlwifi :03:00.0: CONFIG_IWLWIFI_DEBUGFS disabled Mar 14 19:09:05 W520 kernel: [3050195.684148] iwlwifi :03:00.0: CONFIG_IWLWIFI_DEVICE_TRACING disabled Mar 14 19:09:05 W520 kernel: [3050195.684150] iwlwifi :03:00.0: Detected Intel(R) Centrino(R) Advanced-N 6205 AGN, REV=0xB0 Mar 14 19:09:05 W520 kernel: [3050195.712640] ieee80211 phy6: Selected rate control algorithm 'iwl-agn-rs' Mar 14 19:09:05 W520 kernel: [3050195.723818] iwlwifi :03:00.0 wlp3s0: renamed from wlan0 @+ Hugues --- Original Message --- Le samedi 12 mars 2022 à 19:19, didier gaumet a écrit : > Le samedi 12 mars 2022 à 11:58 +0100, Daniel Caillibaud a écrit : > > > Le 12/03/22 à 09:50, didier gaumet didier.gau...@gmail.com a écrit > > > > Oui, j'ai > > > > lsmod|grep ath > > > > ath10k_pci 49152 0 > > > > ath10k_core 430080 1 ath10k_pci > > > > ath 36864 1 ath10k_core > > > > mac80211 1077248 1 ath10k_core > > > > cfg80211 1052672 3 ath,mac80211,ath10k_core > > > > modinfo me dit aussi pour ath10k_pci > > > > depends: ath10k_core > > > > (qui lui ne dépend de personne) > > [...] > > un modinfo ath10k_core confirme les lignes ci-dessus: > > ath10k_core dépend des modules mac80211,cfg80211,ath > > Si tu forces le déchargement du module ath10k_pci, il faut peut-être > > aussi (à confirmer) que tu forces le déchargement des modules > > ath10_core et ath, voire même (ça me paraît moins probable vu ton > > message d'erreur, mais bon...) de mac80211 et cfg80211 publickey - hlarrive@pm.me - 0xE9429B87.asc Description: application/pgp-keys signature.asc Description: OpenPGP digital signature
Re: Comment recharger un module noyau planté ?
Le samedi 12 mars 2022 à 11:58 +0100, Daniel Caillibaud a écrit : > Le 12/03/22 à 09:50, didier gaumet a écrit > Oui, j'ai > > lsmod|grep ath > ath10k_pci 49152 0 > ath10k_core 430080 1 ath10k_pci > ath 36864 1 ath10k_core > mac80211 1077248 1 ath10k_core > cfg80211 1052672 3 ath,mac80211,ath10k_core > > modinfo me dit aussi pour ath10k_pci > depends: ath10k_core > (qui lui ne dépend de personne) [...] un modinfo ath10k_core confirme les lignes ci-dessus: ath10k_core dépend des modules mac80211,cfg80211,ath Si tu forces le déchargement du module ath10k_pci, il faut peut-être aussi (à confirmer) que tu forces le déchargement des modules ath10_core et ath, voire même (ça me paraît moins probable vu ton message d'erreur, mais bon...) de mac80211 et cfg80211
Re: Comment recharger un module noyau planté ?
Le 12/03/22 à 09:50, didier gaumet a écrit : > le module ath10k_pci n'est pas le seul module pour cette famille de > chipsets wifi et peut-être ath10k_pci appelle-t-il ath10k_core > > un > $ lsmod | grep ath10 > te permettra normalement de voir quels modules dépendent de ath10k_pci Oui, j'ai lsmod|grep ath ath10k_pci 49152 0 ath10k_core 430080 1 ath10k_pci ath36864 1 ath10k_core mac80211 1077248 1 ath10k_core cfg80211 1052672 3 ath,mac80211,ath10k_core modinfo me dit aussi pour ath10k_pci depends:ath10k_core (qui lui ne dépend de personne) > je suppose qu'il doit falloir décharger puis recharger certains autres > modules que ath10k_pci pour que ton chipset soit redétecté puis > réinitialisé correctement ok, la prochaine fois je rmmod les deux, puis modprobe ath10k_pci (qui doit charger la dépendances), et si ça marche pas rmmod les deux puis insmod core puis insmod pci, on verra si c'est mieux. -- Daniel La guerre civile est moins détestable que la guerre avec l'étranger. On sait du moins pourquoi l'on s'y bat. Anatole France
Re: Comment recharger un module noyau planté ?
Le vendredi 11 mars 2022 à 23:50 +0100, Daniel Caillibaud a écrit : [...] > Ensuite, un `modprobe -v ath10k_pci` ne dit rien, mais ne fait rien > non plus, sinon écrire dans > kern.log > > Mar 11 23:31:01 dell kernel: [33602.770218] ath10k_pci :02:00.0: > failed to read device register, device is gone > Mar 11 23:31:01 dell kernel: [33602.770222] ath10k_pci :02:00.0: > failed to reset chip: -5 > Mar 11 23:31:03 dell kernel: [33605.371019] ath10k_pci: probe of > :02:00.0 failed with error -5 > > > Mais au moins, la dépose du module planté m'a permis d'éteindre la > machine proprement. [...] didier@hp-notebook14:~$ find /lib/modules -name *ath10* /lib/modules/5.10.0-12-amd64/kernel/drivers/net/wireless/ath/ath10k /lib/modules/5.10.0-12- amd64/kernel/drivers/net/wireless/ath/ath10k/ath10k_pci.ko /lib/modules/5.10.0-12- amd64/kernel/drivers/net/wireless/ath/ath10k/ath10k_usb.ko /lib/modules/5.10.0-12- amd64/kernel/drivers/net/wireless/ath/ath10k/ath10k_core.ko le module ath10k_pci n'est pas le seul module pour cette famille de chipsets wifi et peut-être ath10k_pci appelle-t-il ath10k_core un $ lsmod | grep ath10 te permettra normalement de voir quels modules dépendent de ath10k_pci je suppose qu'il doit falloir décharger puis recharger certains autres modules que ath10k_pci pour que ton chipset soit redétecté puis réinitialisé correctement
Re: Comment recharger un module noyau planté ?
Le 11/03/22 à 10:56, David Martin a écrit : > Salut, > C'est juste le redémarrage qui ne se fait pas ? (boucle) Ça j'en sais rien, je parlais de boucle parce que la succession de messages du kern.log revient en boucle, d'abord du ath10k_pci :02:00.0: failed to wake target for read32 at en rafale, puis du ieee80211 phy0: Hardware restart was requested [ cut here ] ieee80211_restart_work called with hardware scan in progress WARNING: CPU: 1 PID: 57789 at net/mac80211/main.c:261 ieee80211_restart_work+0xf3/0x100 [mac80211] Modules linked in: puis une call trace et ça recommence -- Daniel Je n'ai fait celle-ci plus longue que parce que je n'ai pas eu le loisir de la faire plus courte. Blaise Pascal (Les Provinciales, celle-ci désigne une lettre)
Re: Comment recharger un module noyau planté ?
Le 10/03/22 à 20:09, Daniel Caillibaud a écrit : > Merci, j'essaierai la prochaine fois avec -f et -v, pour voir s'il parvient à > le décharger. avec rmmod -v -f ath10k_pci le -f aura été efficace, il m'a rendu la main aussitôt, mais le -v change pas grand chose, aucun retour. Ensuite, un `modprobe -v ath10k_pci` ne dit rien, mais ne fait rien non plus, sinon écrire dans kern.log Mar 11 23:31:01 dell kernel: [33602.770218] ath10k_pci :02:00.0: failed to read device register, device is gone Mar 11 23:31:01 dell kernel: [33602.770222] ath10k_pci :02:00.0: failed to reset chip: -5 Mar 11 23:31:03 dell kernel: [33605.371019] ath10k_pci: probe of :02:00.0 failed with error -5 Mais au moins, la dépose du module planté m'a permis d'éteindre la machine proprement. Juste une frayeur au reboot, grub m'a répondu que je devais charger un noyau d'abord, un ctrl+alt+suppr pour relancer un nouveau reboot a réglé le pb, ma debian se prend pour windows :-/ (j'avais déjà vu ça après d'autres plantages, le 1er reboot hard échoue, il en faut un 2e pour repartir d'un pied peu dansant ni vaillant mais qui veut bien poser par terre). -- Daniel Si les imbéciles volaient, il ferait nuit. Frédéric Dard
Re: Comment recharger un module noyau planté ?
Salut, C'est juste le redémarrage qui ne se fait pas ? (boucle) Le jeu. 10 mars 2022 à 13:41, Daniel Caillibaud a écrit : > Bonjour, > > J'ai toujours mes pbs de plantage kernel à cause du module wifi > (ath10k_pci), même si ça c'est > arrangé (ça plante 1 à 2 fois par semaine, mais seulement le réseau, avant > tout était figé, > donc je peux sauvegarder ce que je fais, c'est juste pénible avec des > consoles ouvertes ou un > truc en cours dans un navigateur). > > Est-ce que dans un tel cas on peut recharger le module noyau sans reboot > hard ? > (le reboot soft fonctionne pas, le PC veut pas s'arrêter) > > J'ai essayé > rmmod ath10k_pci > (en pensant passer ensuite à insmod ou modprob) > > mais ça ne fait rien, ça ne rend pas la main et ne dit rien (pas pensé à > ajouter -v, je le > ferai la prochaine fois) > > J'étais sur un noyau 5.12.9 compilé maison (avec intel-microcode > 3.20210608.2 de bullseye), je > vais essayer linux-image-5.16.0-0.bpo.3-amd64-unsigned et > intel-microcode=3.20220207.1~bpo11+1 > pour voir si ça s'arrange, mais la réponse m'intéresse quand même. > > > > Le détail : > > 1) modinfo ath10k_pci > > filename: > /lib/modules/5.12.9/kernel/drivers/net/wireless/ath/ath10k/ath10k_pci.ko > … > description:Driver support for Qualcomm Atheros 802.11ac WLAN PCIe/AHB > devices > author: Qualcomm Atheros > … > depends:ath10k_core > retpoline: Y > intree: Y > name: ath10k_pci > vermagic: 5.12.9 SMP mod_unload modversions > parm: irq_mode:0: auto, 1: legacy, 2: msi (default: 0) (uint) > parm: reset_mode:0: auto, 1: warm only (default: 0) (uint) > > > 2) Les messages de kern.log au plantage du module : > > Mar 10 09:36:13 dell kernel: [144708.337905] IPv6: > ADDRCONF(NETDEV_CHANGE): wlp2s0: link becomes ready > Mar 10 09:36:13 dell kernel: [144708.337965] wlp2s0: Limiting TX power to > 23 (26 - 3) dBm as advertised by 68:a3:78:b8:7e:94 > Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0: > failed to wake target for write32 of 0x0579 at 0x0003543c: -110 > [plein de failed to wake target] > Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0: > failed to wake target for read32 at 0x0003a028: -110 > Mar 10 10:17:26 dell kernel: [147182.767232] ath10k_pci :02:00.0: > failed to read device register, device is gone > Mar 10 10:17:26 dell kernel: [147182.768293] ieee80211 phy0: Hardware > restart was requested > Mar 10 10:17:26 dell kernel: [147182.768303] [ cut here > ] > Mar 10 10:17:26 dell kernel: [147182.768304] ieee80211_restart_work called > with hardware scan in progress > Mar 10 10:17:26 dell kernel: [147182.768350] WARNING: CPU: 1 PID: 186880 > at net/mac80211/main.c:261 ieee80211_restart_work+0xf3/0x100 [mac80211] > Mar 10 10:17:26 dell kernel: [147182.768375] Modules linked in: loop(E) > rfcomm(E) ctr(E) ccm(E) cmac(E) algif_hash(E) algif_skcipher(E) af_alg(E) > bnep(E) binfmt_misc(E) intel_rapl_msr(E) dell_smm_hwmon(E) > snd_hda_codec_hdmi(E) x86_pkg_temp_thermal(E) intel_powerclamp(E) > coretemp(E) snd_sof_pci_intel_icl(E) snd_sof_intel_hda_common(E) > soundwire_intel(E) kvm_intel(E) soundwire_generic_allocation(E) > soundwire_cadence(E) snd_sof_intel_hda(E) snd_sof_pci(E) snd_sof(E) kvm(E) > snd_sof_xtensa_dsp(E) snd_soc_hdac_hda(E) snd_hda_ext_core(E) > snd_soc_acpi_intel_match(E) snd_soc_acpi(E) irqbypass(E) rapl(E) > snd_soc_core(E) intel_cstate(E) snd_hda_codec_realtek(E) snd_compress(E) > nls_ascii(E) soundwire_bus(E) snd_hda_codec_generic(E) intel_uncore(E) > ledtrig_audio(E) nls_cp437(E) btusb(E) btrtl(E) snd_hda_intel(E) > ath10k_pci(E) btbcm(E) btintel(E) snd_intel_dspcfg(E) snd_intel_sdw_acpi(E) > ath10k_core(E) vfat(E) pcspkr(E) fat(E) ath(E) bluetooth(E) serio_raw(E) > snd_hda_codec(E) efi_pstore(E) wmi_bmof(E) intel_wmi_thunderbolt(E) > Mar 10 10:17:26 dell kernel: [147182.768403] snd_hda_core(E) snd_hwdep(E) > mac80211(E) snd_pcm(E) iTCO_wdt(E) uvcvideo(E) intel_pmc_bxt(E) > snd_timer(E) iTCO_vendor_support(E) watchdog(E) snd(E) ee1004(E) > videobuf2_vmalloc(E) jitterentropy_rng(E) soundcore(E) videobuf2_memops(E) > videobuf2_v4l2(E) cfg80211(E) drbg(E) videobuf2_common(E) ansi_cprng(E) > processor_thermal_device(E) videodev(E) processor_thermal_rfim(E) > libarc4(E) processor_thermal_mbox(E) mc(E) joydev(E) mei_me(E) > ecdh_generic(E) processor_thermal_rapl(E) rfkill(E) intel_rapl_common(E) > ecc(E) sg(E) mei(E) intel_soc_dts_iosf(E) int3403_thermal(E) > int340x_thermal_zone(E) tpm_crb(E) tpm_tis(E) tpm_tis_core(E) tpm(E) > evdev(E) int3400_thermal(E) rng_core(E) acpi_thermal_rel(E) acpi_tad(E) > intel_pmc_core(E) ac(E) intel_hid(E) sparse_keymap(E) acpi_pad(E) msr(E) > parport_pc(E) ppdev(E) lp(E) parport(E) fuse(E) configfs(E) sunrpc(E) > efivarfs(E) ip_tables(E) x_tables(E) autofs4(E) ext4(E) crc32c_generic(E) > crc16(E) mbcache(E) jbd2(E) dm_crypt(E) dm_mod(E) sr_mod(E) > Mar 10 10:17:26 dell kernel: [147182.768439] sd_mod(E) cd
Re: Comment recharger un module noyau planté ?
Le jeudi 10 mars 2022 à 20:09 +0100, Daniel Caillibaud a écrit : > Le 10/03/22 à 17:41, didier gaumet a écrit > : > > pour le plantage en lui-même, je n'ai pas d'idée à part essayer de > > voir > > (mais où, j'ai oublié) quelles options, si il y en a, sont > > disponibles > > pour charger les modules ath10* > > Je crains que ça ne dépasse mes petites compétences en wifi. > > > pour décharger un module noyau, rmmod est plus "puissant" que > > modprobe > > lorsque utilisé avec l'option -f normalement il force le > > déchargement > > du module > > Merci, j'essaierai la prochaine fois avec -f et -v, pour voir s'il > parvient à le décharger. > > Mais sur le principe, avec un module planté on peut faire rmmod puis > insmod sans avoir à > rebooter ou bien y'a des risques que le plantage ait éclaboussé et > qu'il faille un reboot de > toute manière ? > > (si ça n'a aucune chance de fonctionner c'est pas la peine que > j'essaie) > Pour du wifi à usage personnel, j'aurais tendance à dire que l'on peut décharger puis recharger le module incriminé sans avoir besoin de redémarrer la machine ni de prendre des mesures particulières. Ce que j'entends par là, a priori, c'est que si ta connexion wifi se met en rideau, c'est gênant mais il n'y a pas perte irrémédiable de données: si ton réseau wifi est HS, tu le remets d'aplomb et tu recommences ce que tu faisais. Ce serait différent si tu transmettais tes données dont tu dois garantir l'intégrité sans avoir la possibilité de les réémettre
Re: Comment recharger un module noyau planté ?
Le 10/03/22 à 17:41, didier gaumet a écrit : > pour le plantage en lui-même, je n'ai pas d'idée à part essayer de voir > (mais où, j'ai oublié) quelles options, si il y en a, sont disponibles > pour charger les modules ath10* Je crains que ça ne dépasse mes petites compétences en wifi. > pour décharger un module noyau, rmmod est plus "puissant" que modprobe > lorsque utilisé avec l'option -f normalement il force le déchargement > du module Merci, j'essaierai la prochaine fois avec -f et -v, pour voir s'il parvient à le décharger. Mais sur le principe, avec un module planté on peut faire rmmod puis insmod sans avoir à rebooter ou bien y'a des risques que le plantage ait éclaboussé et qu'il faille un reboot de toute manière ? (si ça n'a aucune chance de fonctionner c'est pas la peine que j'essaie) -- Daniel Celui qui ne sais pas où il va se retrouve ailleurs. Robespierre Avec la variante de Pierre Dac : Ceux qui ne savent pas où ils vont sont surpris d'arriver ailleurs.
Re: Comment recharger un module noyau planté ?
pour le plantage en lui-même, je n'ai pas d'idée à part essayer de voir (mais où, j'ai oublié) quelles options, si il y en a, sont disponibles pour charger les modules ath10* pour décharger un module noyau, rmmod est plus "puissant" que modprobe lorsque utilisé avec l'option -f normalement il force le déchargement du module
Comment recharger un module noyau planté ?
Bonjour, J'ai toujours mes pbs de plantage kernel à cause du module wifi (ath10k_pci), même si ça c'est arrangé (ça plante 1 à 2 fois par semaine, mais seulement le réseau, avant tout était figé, donc je peux sauvegarder ce que je fais, c'est juste pénible avec des consoles ouvertes ou un truc en cours dans un navigateur). Est-ce que dans un tel cas on peut recharger le module noyau sans reboot hard ? (le reboot soft fonctionne pas, le PC veut pas s'arrêter) J'ai essayé rmmod ath10k_pci (en pensant passer ensuite à insmod ou modprob) mais ça ne fait rien, ça ne rend pas la main et ne dit rien (pas pensé à ajouter -v, je le ferai la prochaine fois) J'étais sur un noyau 5.12.9 compilé maison (avec intel-microcode 3.20210608.2 de bullseye), je vais essayer linux-image-5.16.0-0.bpo.3-amd64-unsigned et intel-microcode=3.20220207.1~bpo11+1 pour voir si ça s'arrange, mais la réponse m'intéresse quand même. Le détail : 1) modinfo ath10k_pci filename: /lib/modules/5.12.9/kernel/drivers/net/wireless/ath/ath10k/ath10k_pci.ko … description:Driver support for Qualcomm Atheros 802.11ac WLAN PCIe/AHB devices author: Qualcomm Atheros … depends:ath10k_core retpoline: Y intree: Y name: ath10k_pci vermagic: 5.12.9 SMP mod_unload modversions parm: irq_mode:0: auto, 1: legacy, 2: msi (default: 0) (uint) parm: reset_mode:0: auto, 1: warm only (default: 0) (uint) 2) Les messages de kern.log au plantage du module : Mar 10 09:36:13 dell kernel: [144708.337905] IPv6: ADDRCONF(NETDEV_CHANGE): wlp2s0: link becomes ready Mar 10 09:36:13 dell kernel: [144708.337965] wlp2s0: Limiting TX power to 23 (26 - 3) dBm as advertised by 68:a3:78:b8:7e:94 Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0: failed to wake target for write32 of 0x0579 at 0x0003543c: -110 [plein de failed to wake target] Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0: failed to wake target for read32 at 0x0003a028: -110 Mar 10 10:17:26 dell kernel: [147182.767232] ath10k_pci :02:00.0: failed to read device register, device is gone Mar 10 10:17:26 dell kernel: [147182.768293] ieee80211 phy0: Hardware restart was requested Mar 10 10:17:26 dell kernel: [147182.768303] [ cut here ] Mar 10 10:17:26 dell kernel: [147182.768304] ieee80211_restart_work called with hardware scan in progress Mar 10 10:17:26 dell kernel: [147182.768350] WARNING: CPU: 1 PID: 186880 at net/mac80211/main.c:261 ieee80211_restart_work+0xf3/0x100 [mac80211] Mar 10 10:17:26 dell kernel: [147182.768375] Modules linked in: loop(E) rfcomm(E) ctr(E) ccm(E) cmac(E) algif_hash(E) algif_skcipher(E) af_alg(E) bnep(E) binfmt_misc(E) intel_rapl_msr(E) dell_smm_hwmon(E) snd_hda_codec_hdmi(E) x86_pkg_temp_thermal(E) intel_powerclamp(E) coretemp(E) snd_sof_pci_intel_icl(E) snd_sof_intel_hda_common(E) soundwire_intel(E) kvm_intel(E) soundwire_generic_allocation(E) soundwire_cadence(E) snd_sof_intel_hda(E) snd_sof_pci(E) snd_sof(E) kvm(E) snd_sof_xtensa_dsp(E) snd_soc_hdac_hda(E) snd_hda_ext_core(E) snd_soc_acpi_intel_match(E) snd_soc_acpi(E) irqbypass(E) rapl(E) snd_soc_core(E) intel_cstate(E) snd_hda_codec_realtek(E) snd_compress(E) nls_ascii(E) soundwire_bus(E) snd_hda_codec_generic(E) intel_uncore(E) ledtrig_audio(E) nls_cp437(E) btusb(E) btrtl(E) snd_hda_intel(E) ath10k_pci(E) btbcm(E) btintel(E) snd_intel_dspcfg(E) snd_intel_sdw_acpi(E) ath10k_core(E) vfat(E) pcspkr(E) fat(E) ath(E) bluetooth(E) serio_raw(E) snd_hda_codec(E) efi_pstore(E) wmi_bmof(E) intel_wmi_thunderbolt(E) Mar 10 10:17:26 dell kernel: [147182.768403] snd_hda_core(E) snd_hwdep(E) mac80211(E) snd_pcm(E) iTCO_wdt(E) uvcvideo(E) intel_pmc_bxt(E) snd_timer(E) iTCO_vendor_support(E) watchdog(E) snd(E) ee1004(E) videobuf2_vmalloc(E) jitterentropy_rng(E) soundcore(E) videobuf2_memops(E) videobuf2_v4l2(E) cfg80211(E) drbg(E) videobuf2_common(E) ansi_cprng(E) processor_thermal_device(E) videodev(E) processor_thermal_rfim(E) libarc4(E) processor_thermal_mbox(E) mc(E) joydev(E) mei_me(E) ecdh_generic(E) processor_thermal_rapl(E) rfkill(E) intel_rapl_common(E) ecc(E) sg(E) mei(E) intel_soc_dts_iosf(E) int3403_thermal(E) int340x_thermal_zone(E) tpm_crb(E) tpm_tis(E) tpm_tis_core(E) tpm(E) evdev(E) int3400_thermal(E) rng_core(E) acpi_thermal_rel(E) acpi_tad(E) intel_pmc_core(E) ac(E) intel_hid(E) sparse_keymap(E) acpi_pad(E) msr(E) parport_pc(E) ppdev(E) lp(E) parport(E) fuse(E) configfs(E) sunrpc(E) efivarfs(E) ip_tables(E) x_tables(E) autofs4(E) ext4(E) crc32c_generic(E) crc16(E) mbcache(E) jbd2(E) dm_crypt(E) dm_mod(E) sr_mod(E) Mar 10 10:17:26 dell kernel: [147182.768439] sd_mod(E) cdrom(E) hid_generic(E) usbhid(E) hid(E) crc32_pclmul(E) crc32c_intel(E) ghash_clmulni_intel(E) aesni_intel(E) libaes(E) crypto_simd(E) cryptd(E) i915(E) nvme(E) psmouse(E) nvme_core(E) t10_pi(E) ahci(E) crc_t10dif(E) i2c_algo_bit(E) crct10dif_generic(E) libah