Re: Comment recharger un module noyau planté ?

2022-04-07 Par sujet Daniel Caillibaud
Le 31/03/22 à 15:55, Daniel Caillibaud  a écrit :
> Bonjour,
> 
> Ça faisait longtemps que mon module wifi n'avait pas planté, donc pas eu 
> l'occasion d'essayer
> les remèdes.
> 
> Le 14/03/22 à 18:21, Hugues Larrive  a écrit :
> > Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) :
> > echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove  
> 
> Cette commande a été assez longue a rendre la main, elle a sorti qqchose dans 
> kern.log, mais
> je n'ai pas cette trace car
> 
> > echo 1 > /sys/bus/pci/rescan  
> 
> a complètement planté le système, et après le reboot hard qui a suivi y'avait 
> plus les traces
> précédentes.

J'ai eu d'autres plantages, et cette commande a bien fonctionné, ça m'a évité 
un reboot
(j'avais fermé au préalable tout ce qui pouvait consommer du réseau, je sais 
pas si y'a un
rapport).

Donc merci Hugues, tu avais raison, c'est bien la carte (ou son firmware) qui 
se vautre et pas
le module noyau.

-- 
Daniel

Vaut-il mieux parler bêtement de choses intelligentes
ou parler intelligemment de choses bêtes.
Philippe Geluck, Le chat



Re: Comment recharger un module noyau planté ?

2022-03-31 Par sujet Daniel Caillibaud
Bonjour,

Ça faisait longtemps que mon module wifi n'avait pas planté, donc pas eu 
l'occasion d'essayer les remèdes.

Le 14/03/22 à 18:21, Hugues Larrive  a écrit :
> Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) :
> echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove

Cette commande a été assez longue a rendre la main, elle a sorti qqchose dans 
kern.log, mais je
n'ai pas cette trace car

> echo 1 > /sys/bus/pci/rescan

a complètement planté le système, et après le reboot hard qui a suivi y'avait 
plus les traces
précédentes.

Mar 31 15:26:35 dell kernel: [439827.472935] ath10k_pci :02:00.0: failed to 
wake target for write32 of 0x11e5 at 0x0003543c: -110
[…pas mal de lignes comme la précédente…]
Mar 31 15:30:19 dell kernel: [440052.314672] ath10k_pci :02:00.0: failed to 
wake target for write32 of 0x149f at 0x0003543c: -110
Mar 31 15:30:20 dell kernel: [440053.274771] ath10k_pci :02:00.0: failed to 
receive scan abortion completion: timed out
Mar 31 15:30:20 dell kernel: [440053.274774] ath10k_pci :02:00.0: failed to 
stop scan: -110
Mar 31 15:30:20 dell kernel: [440053.274776] ath10k_pci :02:00.0: failed to 
start hw scan: -110
Mar 31 15:30:20 dell kernel: [440053.33] ath10k_pci :02:00.0: failed to 
wake target for write32 of 0x14a1 at 0x0003543c: -110
[…snip…]
Mar 31 15:31:16 dell kernel: [440108.635954] ath10k_pci :02:00.0: failed to 
wake target for write32 of 0x1521 at 0x0003543c: -110
Mar 31 15:31:16 dell kernel: [440108.823493] ath10k_pci :02:00.0: wmi 
command 20482 timeout, restarting hardware
Mar 31 15:31:16 dell kernel: [440108.823503] ath10k_pci :02:00.0: failed to 
delete WMI vdev 1: -11
Mar 31 15:31:16 dell kernel: [440108.823801] ath10k_pci :02:00.0: failed to 
set 2g txpower 52: -108
Mar 31 15:31:16 dell kernel: [440108.823803] ath10k_pci :02:00.0: failed to 
setup tx power 26: -108
Mar 31 15:31:16 dell kernel: [440108.823803] ath10k_pci :02:00.0: failed to 
recalc tx power: -108
Mar 31 15:31:16 dell kernel: [440108.823810] ath10k_pci :02:00.0: failed to 
set inactivity time for vdev 0: -108
Mar 31 15:31:16 dell kernel: [440108.823811] ath10k_pci :02:00.0: failed to 
setup powersave: -108
Mar 31 15:31:16 dell kernel: [440108.823833] wlp2s0: deauthenticating from 
7c:8f:de:0b:9f:d7 by local choice (Reason: 3=DEAUTH_LEAVING)
Mar 31 15:31:16 dell kernel: [440108.823839] ath10k_pci :02:00.0: failed to 
set inactivity time for vdev 0: -108
Mar 31 15:31:16 dell kernel: [440108.823842] ath10k_pci :02:00.0: failed to 
setup powersave: -108
Mar 31 15:31:21 dell kernel: [440113.667374] ath10k_warn: 133 callbacks 
suppressed
Mar 31 15:31:21 dell kernel: [440113.667378] ath10k_pci :02:00.0: failed to 
wake target for write32 of 0xfffd at 0x00034c10: -110
[…snip…]
Mar 31 15:31:32 dell kernel: [440125.270874] ath10k_pci :02:00.0: failed to 
read device register, device is gone
Mar 31 15:31:32 dell kernel: [440125.272438] ieee80211 phy0: Hardware restart 
was requested
Mar 31 15:31:32 dell kernel: [440125.272774] [ cut here 
]
Mar 31 15:31:32 dell kernel: [440125.272776] WARNING: CPU: 1 PID: 254476 at 
net/mac80211/sta_info.c:1096 __sta_info_destroy_part2+0x130/0x160 [mac80211]
Mar 31 15:31:32 dell kernel: [440125.272806] Modules linked in: btrfs(E) 
blake2b_generic(E) xor(E) raid6_pq(E) zstd_compress(E) ufs(E) qnx4(E) 
hfsplus(E) hfs(E) minix(E) msdos(E) jfs(E) xfs(E) libcrc32c(E) cpuid
(E) loop(E) rfcomm(E) ctr(E) ccm(E) cmac(E) algif_hash(E) algif_skcipher(E) 
af_alg(E) bnep(E) binfmt_misc(E) mei_hdcp(E) intel_rapl_msr(E) dell_laptop(E) 
snd_hda_codec_hdmi(E) dell_smm_hwmon(E) btusb(E) btrtl(E)
 btbcm(E) btintel(E) bluetooth(E) snd_sof_pci_intel_icl(E) snd_ctl_led(E) 
snd_sof_intel_hda_common(E) soundwire_intel(E) soundwire_generic_allocation(E) 
soundwire_cadence(E) snd_sof_intel_hda(E) snd_sof_pci(E) s
nd_sof_xtensa_dsp(E) x86_pkg_temp_thermal(E) ath10k_pci(E) intel_powerclamp(E) 
jitterentropy_rng(E) snd_sof(E) coretemp(E) snd_soc_hdac_hda(E) ath10k_core(E) 
snd_hda_ext_core(E) ath(E) snd_hda_codec_realtek(E) k
vm_intel(E) sha512_ssse3(E) snd_soc_acpi_intel_match(E) snd_soc_acpi(E) 
snd_hda_codec_generic(E) sha512_generic(E) mac80211(E) snd_soc_core(E) kvm(E) 
snd_compress(E) libarc4(E) irqbypass(E)
Mar 31 15:31:32 dell kernel: [440125.272836]  soundwire_bus(E) drbg(E) 
ledtrig_audio(E) nls_ascii(E) ansi_cprng(E) nls_cp437(E) cfg80211(E) rapl(E) 
snd_hda_intel(E) intel_cstate(E) vfat(E) snd_intel_dspcfg(E) sn
d_intel_sdw_acpi(E) fat(E) dell_wmi(E) ecdh_generic(E) intel_uncore(E) 
pcspkr(E) snd_hda_codec(E) dell_smbios(E) dcdbas(E) serio_raw(E) efi_pstore(E) 
snd_hda_core(E) uvcvideo(E) snd_hwdep(E) dell_wmi_sysman(E) v
ideobuf2_vmalloc(E) firmware_attributes_class(E) snd_pcm(E) videobuf2_memops(E) 
iTCO_wdt(E) dell_wmi_descriptor(E) videobuf2_v4l2(E) snd_timer(E) 
intel_pmc_bxt(E) intel_wmi_thunderbolt(E) wmi_bmof(E) videobuf2_c
ommon(E) snd(E) iTCO_v

Re: Comment recharger un module noyau planté ?

2022-03-16 Par sujet Daniel Caillibaud
Le 14/03/22 à 18:21, Hugues Larrive  a écrit :
> Bonjour,
> 
> Au vu du kern.log, j'ai l'impression que c'est la carte wifi qui plante et 
> non le module :
> Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0: failed 
> to wake target
> for write32 of 0x0579 at 0x0003543c: -110 [plein de failed to wake target]
> Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0: failed 
> to wake target
> for read32 at 0x0003a028: -110 Mar 10 10:17:26 dell kernel: [147182.767232] 
> ath10k_pci
> :02:00.0: failed to read device register, device is gone Mar 10 10:17:26 
> dell kernel:
> [147182.768293] ieee80211 phy0: Hardware restart was requested
> 
> Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) :
> echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove
> echo 1 > /sys/bus/pci/rescan

Merci pour cette piste très intéressante !
Je teste ça au prochain plantage et je vous donnerai le résultat.

-- 
Daniel

Un beau livre, c'est celui qui sème à foison les points d'interrogation.
Jean Cocteau



Re: Comment recharger un module noyau planté ?

2022-03-14 Par sujet Hugues Larrive
Bonjour,

Au vu du kern.log, j'ai l'impression que c'est la carte wifi qui plante et non 
le module :
Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0: failed to 
wake target for write32 of 0x0579 at 0x0003543c: -110
[plein de failed to wake target]
Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0: failed to 
wake target for read32 at 0x0003a028: -110
Mar 10 10:17:26 dell kernel: [147182.767232] ath10k_pci :02:00.0: failed to 
read device register, device is gone
Mar 10 10:17:26 dell kernel: [147182.768293] ieee80211 phy0: Hardware restart 
was requested

Je tenterais une réinitialisation au niveau du bus PCI (remove et rescan) :
echo 1 > /sys/bus/pci/devices/\:02\:00.0/remove
echo 1 > /sys/bus/pci/rescan

Chez moi ça donne ça dans le kern.log :
Mar 14 19:09:05 W520 kernel: [3050195.682506] pci :03:00.0: [8086:0085] 
type 00 class 0x028000
Mar 14 19:09:05 W520 kernel: [3050195.682577] pci :03:00.0: reg 0x10: [mem 
0xd520-0xd5201fff 64bit]
Mar 14 19:09:05 W520 kernel: [3050195.682836] pci :03:00.0: PME# supported 
from D0 D3hot D3cold
Mar 14 19:09:05 W520 kernel: [3050195.683162] pci :03:00.0: BAR 0: assigned 
[mem 0xd520-0xd5201fff 64bit]
Mar 14 19:09:05 W520 kernel: [3050195.683313] iwlwifi :03:00.0: can't 
disable ASPM; OS doesn't have ASPM control
Mar 14 19:09:05 W520 kernel: [3050195.683936] iwlwifi :03:00.0: firmware: 
direct-loading firmware iwlwifi-6000g2a-6.ucode
Mar 14 19:09:05 W520 kernel: [3050195.684130] iwlwifi :03:00.0: loaded 
firmware version 18.168.6.1 op_mode iwldvm
Mar 14 19:09:05 W520 kernel: [3050195.684146] iwlwifi :03:00.0: 
CONFIG_IWLWIFI_DEBUG disabled
Mar 14 19:09:05 W520 kernel: [3050195.684147] iwlwifi :03:00.0: 
CONFIG_IWLWIFI_DEBUGFS disabled
Mar 14 19:09:05 W520 kernel: [3050195.684148] iwlwifi :03:00.0: 
CONFIG_IWLWIFI_DEVICE_TRACING disabled
Mar 14 19:09:05 W520 kernel: [3050195.684150] iwlwifi :03:00.0: Detected 
Intel(R) Centrino(R) Advanced-N 6205 AGN, REV=0xB0
Mar 14 19:09:05 W520 kernel: [3050195.712640] ieee80211 phy6: Selected rate 
control algorithm 'iwl-agn-rs'
Mar 14 19:09:05 W520 kernel: [3050195.723818] iwlwifi :03:00.0 wlp3s0: 
renamed from wlan0

@+
Hugues

--- Original Message ---

Le samedi 12 mars 2022 à 19:19, didier gaumet  a écrit 
:

> Le samedi 12 mars 2022 à 11:58 +0100, Daniel Caillibaud a écrit :
> 

> > Le 12/03/22 à 09:50, didier gaumet didier.gau...@gmail.com a écrit
> > 

> > Oui, j'ai
> > 

> > lsmod|grep ath
> > 

> > ath10k_pci 49152 0
> > 

> > ath10k_core 430080 1 ath10k_pci
> > 

> > ath 36864 1 ath10k_core
> > 

> > mac80211 1077248 1 ath10k_core
> > 

> > cfg80211 1052672 3 ath,mac80211,ath10k_core
> > 

> > modinfo me dit aussi pour ath10k_pci
> > 

> > depends: ath10k_core
> > 

> > (qui lui ne dépend de personne)
> 

> [...]
> 

> un modinfo ath10k_core confirme les lignes ci-dessus:
> 

> ath10k_core dépend des modules mac80211,cfg80211,ath
> 

> Si tu forces le déchargement du module ath10k_pci, il faut peut-être
> 

> aussi (à confirmer) que tu forces le déchargement des modules
> 

> ath10_core et ath, voire même (ça me paraît moins probable vu ton
> 

> message d'erreur, mais bon...) de mac80211 et cfg80211

publickey - hlarrive@pm.me - 0xE9429B87.asc
Description: application/pgp-keys


signature.asc
Description: OpenPGP digital signature


Re: Comment recharger un module noyau planté ?

2022-03-12 Par sujet didier gaumet


Le samedi 12 mars 2022 à 11:58 +0100, Daniel Caillibaud a écrit :
> Le 12/03/22 à 09:50, didier gaumet  a écrit 
> Oui, j'ai 
> 
> lsmod|grep ath
> ath10k_pci 49152  0
> ath10k_core   430080  1 ath10k_pci
> ath    36864  1 ath10k_core
> mac80211 1077248  1 ath10k_core
> cfg80211 1052672  3 ath,mac80211,ath10k_core
> 
> modinfo me dit aussi pour ath10k_pci
> depends:    ath10k_core
> (qui lui ne dépend de personne)
[...]

un modinfo ath10k_core confirme les lignes ci-dessus:
ath10k_core dépend des modules mac80211,cfg80211,ath

Si tu forces le déchargement du module ath10k_pci, il faut peut-être
aussi (à confirmer) que tu forces le déchargement des modules
ath10_core et ath, voire même (ça me paraît moins probable vu ton
message d'erreur, mais bon...) de mac80211 et cfg80211


Re: Comment recharger un module noyau planté ?

2022-03-12 Par sujet Daniel Caillibaud
Le 12/03/22 à 09:50, didier gaumet  a écrit :
> le module ath10k_pci n'est pas le seul module pour cette famille de
> chipsets wifi et peut-être ath10k_pci appelle-t-il ath10k_core
> 
> un 
> $ lsmod | grep ath10
> te permettra normalement de voir quels modules dépendent de ath10k_pci

Oui, j'ai 

lsmod|grep ath
ath10k_pci 49152  0
ath10k_core   430080  1 ath10k_pci
ath36864  1 ath10k_core
mac80211 1077248  1 ath10k_core
cfg80211 1052672  3 ath,mac80211,ath10k_core

modinfo me dit aussi pour ath10k_pci
depends:ath10k_core
(qui lui ne dépend de personne)

> je suppose qu'il doit falloir décharger puis recharger certains autres
> modules que ath10k_pci pour que ton chipset soit redétecté puis
> réinitialisé correctement

ok, la prochaine fois je rmmod les deux, puis modprobe ath10k_pci (qui doit 
charger la
dépendances), et si ça marche pas rmmod les deux puis insmod core puis insmod 
pci, on verra si
c'est mieux.

-- 
Daniel

La guerre civile est moins détestable que la guerre avec l'étranger. 
On sait du moins pourquoi l'on s'y bat.
Anatole France



Re: Comment recharger un module noyau planté ?

2022-03-12 Par sujet didier gaumet



Le vendredi 11 mars 2022 à 23:50 +0100, Daniel Caillibaud a écrit :

[...]
> Ensuite, un `modprobe -v ath10k_pci` ne dit rien, mais ne fait rien
> non plus, sinon écrire dans
> kern.log
> 
> Mar 11 23:31:01 dell kernel: [33602.770218] ath10k_pci :02:00.0:
> failed to read device register, device is gone
> Mar 11 23:31:01 dell kernel: [33602.770222] ath10k_pci :02:00.0:
> failed to reset chip: -5
> Mar 11 23:31:03 dell kernel: [33605.371019] ath10k_pci: probe of
> :02:00.0 failed with error -5
> 
> 
> Mais au moins, la dépose du module planté m'a permis d'éteindre la
> machine proprement.
[...]

didier@hp-notebook14:~$ find /lib/modules -name *ath10*
/lib/modules/5.10.0-12-amd64/kernel/drivers/net/wireless/ath/ath10k
/lib/modules/5.10.0-12-
amd64/kernel/drivers/net/wireless/ath/ath10k/ath10k_pci.ko
/lib/modules/5.10.0-12-
amd64/kernel/drivers/net/wireless/ath/ath10k/ath10k_usb.ko
/lib/modules/5.10.0-12-
amd64/kernel/drivers/net/wireless/ath/ath10k/ath10k_core.ko

le module ath10k_pci n'est pas le seul module pour cette famille de
chipsets wifi et peut-être ath10k_pci appelle-t-il ath10k_core

un 
$ lsmod | grep ath10
te permettra normalement de voir quels modules dépendent de ath10k_pci

je suppose qu'il doit falloir décharger puis recharger certains autres
modules que ath10k_pci pour que ton chipset soit redétecté puis
réinitialisé correctement




Re: Comment recharger un module noyau planté ?

2022-03-11 Par sujet Daniel Caillibaud
Le 11/03/22 à 10:56, David Martin  a écrit :

> Salut,
> C'est juste le redémarrage qui ne se fait pas ? (boucle)

Ça j'en sais rien, je parlais de boucle parce que la succession de messages du 
kern.log
revient en boucle, d'abord du
  ath10k_pci :02:00.0: failed to wake target for read32 at
en rafale, puis du 

ieee80211 phy0: Hardware restart was requested
[ cut here ]
ieee80211_restart_work called with hardware scan in progress
WARNING: CPU: 1 PID: 57789 at net/mac80211/main.c:261 
ieee80211_restart_work+0xf3/0x100 [mac80211]
Modules linked in: 

puis une call trace

et ça recommence

-- 
Daniel

Je n'ai fait celle-ci plus longue que parce que je n'ai 
pas eu le loisir de la faire plus courte.
Blaise Pascal (Les Provinciales, celle-ci désigne une lettre)



Re: Comment recharger un module noyau planté ?

2022-03-11 Par sujet Daniel Caillibaud
Le 10/03/22 à 20:09, Daniel Caillibaud  a écrit :
> Merci, j'essaierai la prochaine fois avec -f et -v, pour voir s'il parvient à 
> le décharger.

avec 

  rmmod -v -f ath10k_pci

le -f aura été efficace, il m'a rendu la main aussitôt, mais le -v change pas 
grand chose,
aucun retour.

Ensuite, un `modprobe -v ath10k_pci` ne dit rien, mais ne fait rien non plus, 
sinon écrire dans
kern.log

Mar 11 23:31:01 dell kernel: [33602.770218] ath10k_pci :02:00.0: failed to 
read device register, device is gone
Mar 11 23:31:01 dell kernel: [33602.770222] ath10k_pci :02:00.0: failed to 
reset chip: -5
Mar 11 23:31:03 dell kernel: [33605.371019] ath10k_pci: probe of :02:00.0 
failed with error -5


Mais au moins, la dépose du module planté m'a permis d'éteindre la machine 
proprement.

Juste une frayeur au reboot, grub m'a répondu que je devais charger un noyau 
d'abord, un ctrl+alt+suppr 
pour relancer un nouveau reboot a réglé le pb, ma debian se prend pour windows 
:-/

(j'avais déjà vu ça après d'autres plantages, le 1er reboot hard échoue, il en 
faut un 2e pour repartir d'un pied 
peu dansant ni vaillant mais qui veut bien poser par terre).

-- 
Daniel

Si les imbéciles volaient, il ferait nuit.
Frédéric Dard



Re: Comment recharger un module noyau planté ?

2022-03-11 Par sujet David Martin
Salut,
C'est juste le redémarrage qui ne se fait pas ? (boucle)


Le jeu. 10 mars 2022 à 13:41, Daniel Caillibaud  a
écrit :

> Bonjour,
>
> J'ai toujours mes pbs de plantage kernel à cause du module wifi
> (ath10k_pci), même si ça c'est
> arrangé (ça plante 1 à 2 fois par semaine, mais seulement le réseau, avant
> tout était figé,
> donc je peux sauvegarder ce que je fais, c'est juste pénible avec des
> consoles ouvertes ou un
> truc en cours dans un navigateur).
>
> Est-ce que dans un tel cas on peut recharger le module noyau sans reboot
> hard ?
> (le reboot soft fonctionne pas, le PC veut pas s'arrêter)
>
> J'ai essayé
>   rmmod ath10k_pci
> (en pensant passer ensuite à insmod ou modprob)
>
> mais ça ne fait rien, ça ne rend pas la main et ne dit rien (pas pensé à
> ajouter -v, je le
> ferai la prochaine fois)
>
> J'étais sur un noyau 5.12.9 compilé maison (avec intel-microcode
> 3.20210608.2 de bullseye), je
> vais essayer linux-image-5.16.0-0.bpo.3-amd64-unsigned et
> intel-microcode=3.20220207.1~bpo11+1
> pour voir si ça s'arrange, mais la réponse m'intéresse quand même.
>
>
>
> Le détail :
>
> 1) modinfo ath10k_pci
>
> filename:
>  /lib/modules/5.12.9/kernel/drivers/net/wireless/ath/ath10k/ath10k_pci.ko
> …
> description:Driver support for Qualcomm Atheros 802.11ac WLAN PCIe/AHB
> devices
> author: Qualcomm Atheros
> …
> depends:ath10k_core
> retpoline:  Y
> intree: Y
> name:   ath10k_pci
> vermagic:   5.12.9 SMP mod_unload modversions
> parm:   irq_mode:0: auto, 1: legacy, 2: msi (default: 0) (uint)
> parm:   reset_mode:0: auto, 1: warm only (default: 0) (uint)
>
>
> 2) Les messages de kern.log au plantage du module :
>
> Mar 10 09:36:13 dell kernel: [144708.337905] IPv6:
> ADDRCONF(NETDEV_CHANGE): wlp2s0: link becomes ready
> Mar 10 09:36:13 dell kernel: [144708.337965] wlp2s0: Limiting TX power to
> 23 (26 - 3) dBm as advertised by 68:a3:78:b8:7e:94
> Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0:
> failed to wake target for write32 of 0x0579 at 0x0003543c: -110
> [plein de failed to wake target]
> Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0:
> failed to wake target for read32 at 0x0003a028: -110
> Mar 10 10:17:26 dell kernel: [147182.767232] ath10k_pci :02:00.0:
> failed to read device register, device is gone
> Mar 10 10:17:26 dell kernel: [147182.768293] ieee80211 phy0: Hardware
> restart was requested
> Mar 10 10:17:26 dell kernel: [147182.768303] [ cut here
> ]
> Mar 10 10:17:26 dell kernel: [147182.768304] ieee80211_restart_work called
> with hardware scan in progress
> Mar 10 10:17:26 dell kernel: [147182.768350] WARNING: CPU: 1 PID: 186880
> at net/mac80211/main.c:261 ieee80211_restart_work+0xf3/0x100 [mac80211]
> Mar 10 10:17:26 dell kernel: [147182.768375] Modules linked in: loop(E)
> rfcomm(E) ctr(E) ccm(E) cmac(E) algif_hash(E) algif_skcipher(E) af_alg(E)
> bnep(E) binfmt_misc(E) intel_rapl_msr(E) dell_smm_hwmon(E)
> snd_hda_codec_hdmi(E) x86_pkg_temp_thermal(E) intel_powerclamp(E)
> coretemp(E) snd_sof_pci_intel_icl(E) snd_sof_intel_hda_common(E)
> soundwire_intel(E) kvm_intel(E) soundwire_generic_allocation(E)
> soundwire_cadence(E) snd_sof_intel_hda(E) snd_sof_pci(E) snd_sof(E) kvm(E)
> snd_sof_xtensa_dsp(E) snd_soc_hdac_hda(E) snd_hda_ext_core(E)
> snd_soc_acpi_intel_match(E) snd_soc_acpi(E) irqbypass(E) rapl(E)
> snd_soc_core(E) intel_cstate(E) snd_hda_codec_realtek(E) snd_compress(E)
> nls_ascii(E) soundwire_bus(E) snd_hda_codec_generic(E) intel_uncore(E)
> ledtrig_audio(E) nls_cp437(E) btusb(E) btrtl(E) snd_hda_intel(E)
> ath10k_pci(E) btbcm(E) btintel(E) snd_intel_dspcfg(E) snd_intel_sdw_acpi(E)
> ath10k_core(E) vfat(E) pcspkr(E) fat(E) ath(E) bluetooth(E) serio_raw(E)
> snd_hda_codec(E) efi_pstore(E) wmi_bmof(E) intel_wmi_thunderbolt(E)
> Mar 10 10:17:26 dell kernel: [147182.768403]  snd_hda_core(E) snd_hwdep(E)
> mac80211(E) snd_pcm(E) iTCO_wdt(E) uvcvideo(E) intel_pmc_bxt(E)
> snd_timer(E) iTCO_vendor_support(E) watchdog(E) snd(E) ee1004(E)
> videobuf2_vmalloc(E) jitterentropy_rng(E) soundcore(E) videobuf2_memops(E)
> videobuf2_v4l2(E) cfg80211(E) drbg(E) videobuf2_common(E) ansi_cprng(E)
> processor_thermal_device(E) videodev(E) processor_thermal_rfim(E)
> libarc4(E) processor_thermal_mbox(E) mc(E) joydev(E) mei_me(E)
> ecdh_generic(E) processor_thermal_rapl(E) rfkill(E) intel_rapl_common(E)
> ecc(E) sg(E) mei(E) intel_soc_dts_iosf(E) int3403_thermal(E)
> int340x_thermal_zone(E) tpm_crb(E) tpm_tis(E) tpm_tis_core(E) tpm(E)
> evdev(E) int3400_thermal(E) rng_core(E) acpi_thermal_rel(E) acpi_tad(E)
> intel_pmc_core(E) ac(E) intel_hid(E) sparse_keymap(E) acpi_pad(E) msr(E)
> parport_pc(E) ppdev(E) lp(E) parport(E) fuse(E) configfs(E) sunrpc(E)
> efivarfs(E) ip_tables(E) x_tables(E) autofs4(E) ext4(E) crc32c_generic(E)
> crc16(E) mbcache(E) jbd2(E) dm_crypt(E) dm_mod(E) sr_mod(E)
> Mar 10 10:17:26 dell kernel: [147182.768439]  sd_mod(E) cd

Re: Comment recharger un module noyau planté ?

2022-03-10 Par sujet didier gaumet



Le jeudi 10 mars 2022 à 20:09 +0100, Daniel Caillibaud a écrit :
> Le 10/03/22 à 17:41, didier gaumet  a écrit
> :
> > pour le plantage en lui-même, je n'ai pas d'idée à part essayer de
> > voir
> > (mais où, j'ai oublié) quelles options, si il y en a, sont
> > disponibles
> > pour charger les modules ath10*
> 
> Je crains que ça ne dépasse mes petites compétences en wifi.
> 
> > pour décharger un module noyau, rmmod est plus "puissant" que
> > modprobe
> > lorsque utilisé avec l'option -f normalement il force le
> > déchargement
> > du module 
> 
> Merci, j'essaierai la prochaine fois avec -f et -v, pour voir s'il
> parvient à le décharger.
> 
> Mais sur le principe, avec un module planté on peut faire rmmod puis
> insmod sans avoir à
> rebooter ou bien y'a des risques que le plantage ait éclaboussé et
> qu'il faille un reboot de
> toute manière ?
> 
> (si ça n'a aucune chance de fonctionner c'est pas la peine que
> j'essaie)
> 

Pour du wifi à usage personnel, j'aurais tendance à dire que l'on peut
décharger puis recharger le module incriminé sans avoir besoin de
redémarrer la machine ni de prendre des mesures particulières.
Ce que j'entends par là, a priori, c'est que si ta connexion wifi se
met en rideau, c'est gênant mais il n'y a pas perte irrémédiable de
données: si ton réseau wifi est HS, tu le remets d'aplomb et tu
recommences ce que tu faisais. Ce serait différent si tu transmettais
tes données dont tu dois garantir l'intégrité sans avoir la possibilité
de les réémettre




Re: Comment recharger un module noyau planté ?

2022-03-10 Par sujet Daniel Caillibaud
Le 10/03/22 à 17:41, didier gaumet  a écrit :
> pour le plantage en lui-même, je n'ai pas d'idée à part essayer de voir
> (mais où, j'ai oublié) quelles options, si il y en a, sont disponibles
> pour charger les modules ath10*

Je crains que ça ne dépasse mes petites compétences en wifi.

> pour décharger un module noyau, rmmod est plus "puissant" que modprobe
> lorsque utilisé avec l'option -f normalement il force le déchargement
> du module 

Merci, j'essaierai la prochaine fois avec -f et -v, pour voir s'il parvient à 
le décharger.

Mais sur le principe, avec un module planté on peut faire rmmod puis insmod 
sans avoir à
rebooter ou bien y'a des risques que le plantage ait éclaboussé et qu'il faille 
un reboot de
toute manière ?

(si ça n'a aucune chance de fonctionner c'est pas la peine que j'essaie)

-- 
Daniel

Celui qui ne sais pas où il va se retrouve ailleurs.
Robespierre
Avec la variante de Pierre Dac :
Ceux qui ne savent pas où ils vont sont surpris d'arriver ailleurs.



Re: Comment recharger un module noyau planté ?

2022-03-10 Par sujet didier gaumet
pour le plantage en lui-même, je n'ai pas d'idée à part essayer de voir
(mais où, j'ai oublié) quelles options, si il y en a, sont disponibles
pour charger les modules ath10*

pour décharger un module noyau, rmmod est plus "puissant" que modprobe
lorsque utilisé avec l'option -f normalement il force le déchargement
du module 




Comment recharger un module noyau planté ?

2022-03-10 Par sujet Daniel Caillibaud
Bonjour,

J'ai toujours mes pbs de plantage kernel à cause du module wifi (ath10k_pci), 
même si ça c'est
arrangé (ça plante 1 à 2 fois par semaine, mais seulement le réseau, avant tout 
était figé, 
donc je peux sauvegarder ce que je fais, c'est juste pénible avec des consoles 
ouvertes ou un
truc en cours dans un navigateur).

Est-ce que dans un tel cas on peut recharger le module noyau sans reboot hard ?
(le reboot soft fonctionne pas, le PC veut pas s'arrêter)

J'ai essayé 
  rmmod ath10k_pci
(en pensant passer ensuite à insmod ou modprob)

mais ça ne fait rien, ça ne rend pas la main et ne dit rien (pas pensé à 
ajouter -v, je le
ferai la prochaine fois)

J'étais sur un noyau 5.12.9 compilé maison (avec intel-microcode 3.20210608.2 
de bullseye), je 
vais essayer linux-image-5.16.0-0.bpo.3-amd64-unsigned et 
intel-microcode=3.20220207.1~bpo11+1 
pour voir si ça s'arrange, mais la réponse m'intéresse quand même.



Le détail :

1) modinfo ath10k_pci

filename:   
/lib/modules/5.12.9/kernel/drivers/net/wireless/ath/ath10k/ath10k_pci.ko
…
description:Driver support for Qualcomm Atheros 802.11ac WLAN PCIe/AHB 
devices
author: Qualcomm Atheros
…
depends:ath10k_core
retpoline:  Y
intree: Y
name:   ath10k_pci
vermagic:   5.12.9 SMP mod_unload modversions 
parm:   irq_mode:0: auto, 1: legacy, 2: msi (default: 0) (uint)
parm:   reset_mode:0: auto, 1: warm only (default: 0) (uint)


2) Les messages de kern.log au plantage du module :

Mar 10 09:36:13 dell kernel: [144708.337905] IPv6: ADDRCONF(NETDEV_CHANGE): 
wlp2s0: link becomes ready
Mar 10 09:36:13 dell kernel: [144708.337965] wlp2s0: Limiting TX power to 23 
(26 - 3) dBm as advertised by 68:a3:78:b8:7e:94
Mar 10 10:14:13 dell kernel: [146989.982839] ath10k_pci :02:00.0: failed to 
wake target for write32 of 0x0579 at 0x0003543c: -110
[plein de failed to wake target]
Mar 10 10:17:23 dell kernel: [147179.685280] ath10k_pci :02:00.0: failed to 
wake target for read32 at 0x0003a028: -110
Mar 10 10:17:26 dell kernel: [147182.767232] ath10k_pci :02:00.0: failed to 
read device register, device is gone
Mar 10 10:17:26 dell kernel: [147182.768293] ieee80211 phy0: Hardware restart 
was requested
Mar 10 10:17:26 dell kernel: [147182.768303] [ cut here 
]
Mar 10 10:17:26 dell kernel: [147182.768304] ieee80211_restart_work called with 
hardware scan in progress
Mar 10 10:17:26 dell kernel: [147182.768350] WARNING: CPU: 1 PID: 186880 at 
net/mac80211/main.c:261 ieee80211_restart_work+0xf3/0x100 [mac80211]
Mar 10 10:17:26 dell kernel: [147182.768375] Modules linked in: loop(E) 
rfcomm(E) ctr(E) ccm(E) cmac(E) algif_hash(E) algif_skcipher(E) af_alg(E) 
bnep(E) binfmt_misc(E) intel_rapl_msr(E) dell_smm_hwmon(E) 
snd_hda_codec_hdmi(E) x86_pkg_temp_thermal(E) intel_powerclamp(E) coretemp(E) 
snd_sof_pci_intel_icl(E) snd_sof_intel_hda_common(E) soundwire_intel(E) 
kvm_intel(E) soundwire_generic_allocation(E) soundwire_cadence(E) 
snd_sof_intel_hda(E) snd_sof_pci(E) snd_sof(E) kvm(E) snd_sof_xtensa_dsp(E) 
snd_soc_hdac_hda(E) snd_hda_ext_core(E) snd_soc_acpi_intel_match(E) 
snd_soc_acpi(E) irqbypass(E) rapl(E) snd_soc_core(E) intel_cstate(E) 
snd_hda_codec_realtek(E) snd_compress(E) nls_ascii(E) soundwire_bus(E) 
snd_hda_codec_generic(E) intel_uncore(E) ledtrig_audio(E) nls_cp437(E) btusb(E) 
btrtl(E) snd_hda_intel(E) ath10k_pci(E) btbcm(E) btintel(E) snd_intel_dspcfg(E) 
snd_intel_sdw_acpi(E) ath10k_core(E) vfat(E) pcspkr(E) fat(E) ath(E) 
bluetooth(E) serio_raw(E) snd_hda_codec(E) efi_pstore(E) wmi_bmof(E) 
intel_wmi_thunderbolt(E)
Mar 10 10:17:26 dell kernel: [147182.768403]  snd_hda_core(E) snd_hwdep(E) 
mac80211(E) snd_pcm(E) iTCO_wdt(E) uvcvideo(E) intel_pmc_bxt(E) snd_timer(E) 
iTCO_vendor_support(E) watchdog(E) snd(E) ee1004(E) videobuf2_vmalloc(E) 
jitterentropy_rng(E) soundcore(E) videobuf2_memops(E) videobuf2_v4l2(E) 
cfg80211(E) drbg(E) videobuf2_common(E) ansi_cprng(E) 
processor_thermal_device(E) videodev(E) processor_thermal_rfim(E) libarc4(E) 
processor_thermal_mbox(E) mc(E) joydev(E) mei_me(E) ecdh_generic(E) 
processor_thermal_rapl(E) rfkill(E) intel_rapl_common(E) ecc(E) sg(E) mei(E) 
intel_soc_dts_iosf(E) int3403_thermal(E) int340x_thermal_zone(E) tpm_crb(E) 
tpm_tis(E) tpm_tis_core(E) tpm(E) evdev(E) int3400_thermal(E) rng_core(E) 
acpi_thermal_rel(E) acpi_tad(E) intel_pmc_core(E) ac(E) intel_hid(E) 
sparse_keymap(E) acpi_pad(E) msr(E) parport_pc(E) ppdev(E) lp(E) parport(E) 
fuse(E) configfs(E) sunrpc(E) efivarfs(E) ip_tables(E) x_tables(E) autofs4(E) 
ext4(E) crc32c_generic(E) crc16(E) mbcache(E) jbd2(E) dm_crypt(E) dm_mod(E) 
sr_mod(E)
Mar 10 10:17:26 dell kernel: [147182.768439]  sd_mod(E) cdrom(E) hid_generic(E) 
usbhid(E) hid(E) crc32_pclmul(E) crc32c_intel(E) ghash_clmulni_intel(E) 
aesni_intel(E) libaes(E) crypto_simd(E) cryptd(E) i915(E) nvme(E) psmouse(E) 
nvme_core(E) t10_pi(E) ahci(E) crc_t10dif(E) i2c_algo_bit(E) 
crct10dif_generic(E) libah