subject:"Re\: \[python\] xml parsování"

Re: [python] xml parsování

2019-08-13 Tema obsahu Petr Messner

To je nějaký komunikační standard nebo tak něco? Máš odkaz na nějakou 
dokumentaci? Spíš tipuju, že existuje způsob, jak s tím pracovat rozumně, než 
odchytávat nějaký zmatek a snažit se naparsovat ten kousek, co se povedlo 
odchytit. Co je to za zařízení?

Petr Messner

13. 8. 2019 v 14:38, Ondrej Beranek :

> Ahoj,
> 
> Trosku to rozvedu, existuje zarizeni co generuje XML po multicast
> vysilani. problem je ze ho zapnes a ono jede a jede a jede co mas mas,
> co ne jsi ztratil. Kdyz se k nemu pripojis tak ti uz chybi hlavicka a
> chytis to v pulce neceho. tak zacnes chytat co mas a postupne skladas
> strom. Muze se ale stat (a stava se) ze se tagy kapku pokrizi a misto
> koncu vetvi /B /A se obevi /A /B s tim ze mezitim jeste litaji nejaka
> data. V takovemto pripade o situaci chci vedet a sam si ji podle uz
> nactene urovne osetrit. Cast dat jsou data predana takze si nejsem ani
> jist tim ze se struktura nemuze pozmenit...
> 
> 
> Aby toho nebylo malo nektere tagy pro jistotu nahodne nekonci vubec
> ale da se dopocitat jejich zanoreni. A podobne kratochvile.
> 
> Jo a zarizeni nemuzu restartovat.
> 
> 
> 13.08.19, starenka . :
>> tak spatny xml se obcas prihodi, kdyz to nejakej jouda generuje nejak
>> obskurne, nebo se ti usekne stream nebo nevimcoeste lxml ucrite umi
>> podoktorovat html, mozna i xml
>> ---
>> In Perl you shoot yourself in the foot, but nobody can understand how you
>> did it. Six months later, neither can you. | print 'aknerats'[::-1]
>> 
>> 
>> On Tue, Aug 13, 2019 at 1:06 PM Petr Messner 
>> wrote:
>> 
>>> Jak jako vadný tag? Potom to není XML.
>>> 
>>> Na HTML použij HTML parser.
>>> 
>>> Petr Messner
>>> 
>>> 13. 8. 2019 v 11:30, Ondrej Beranek :
>>> 
 Ahoj,
 
 když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
 předem neznámého obsahu, co na to použít ? Potřebuju aby se to
 nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
 Tak než začnu psát kolo...
 
 rainbof
 
 13.08.19, Petr Messner :
> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
> 
> PM
> 
> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek
> >>> 
> napsal:
> 
>> Ahoj.
>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
>> Pro ty hodnoty, které jsou u > 
>> from xml.dom import minidom
>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
>> streamlist = xmldoc.getElementsByTagName('stream')
>> for s in streamlist:
>>   print(s.attributes['index'].value)
>>   print(s.attributes['codec_name'].value)
>>   try:
>>   print(s.attributes['sample_rate'].value)
>>   except:
>>   print('none')
>> 
>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
>> > index="1"
>> 
>> Mohli byste mi, prosím, poradit?
>> 
>> Děkuji Ctibor
>> 
>> 
>> 
>> 
>> ___
>> Python mailing list
>> python@py.cz
>> http://www.py.cz/mailman/listinfo/python
>> 
>> Visit: http://www.py.cz
>> 
> 
 ___
 Python mailing list
 python@py.cz
 http://www.py.cz/mailman/listinfo/python
 
 Visit: http://www.py.cz
>>> ___
>>> Python mailing list
>>> python@py.cz
>>> http://www.py.cz/mailman/listinfo/python
>>> 
>>> Visit: http://www.py.cz
>>> 
>> 
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
> 
> Visit: http://www.py.cz
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

2019-08-13 Tema obsahu Ondrej Beranek

Ahoj,

Trosku to rozvedu, existuje zarizeni co generuje XML po multicast
vysilani. problem je ze ho zapnes a ono jede a jede a jede co mas mas,
co ne jsi ztratil. Kdyz se k nemu pripojis tak ti uz chybi hlavicka a
chytis to v pulce neceho. tak zacnes chytat co mas a postupne skladas
strom. Muze se ale stat (a stava se) ze se tagy kapku pokrizi a misto
koncu vetvi /B /A se obevi /A /B s tim ze mezitim jeste litaji nejaka
data. V takovemto pripade o situaci chci vedet a sam si ji podle uz
nactene urovne osetrit. Cast dat jsou data predana takze si nejsem ani
jist tim ze se struktura nemuze pozmenit...


Aby toho nebylo malo nektere tagy pro jistotu nahodne nekonci vubec
ale da se dopocitat jejich zanoreni. A podobne kratochvile.

Jo a zarizeni nemuzu restartovat.


13.08.19, starenka . :
> tak spatny xml se obcas prihodi, kdyz to nejakej jouda generuje nejak
> obskurne, nebo se ti usekne stream nebo nevimcoeste lxml ucrite umi
> podoktorovat html, mozna i xml
> ---
> In Perl you shoot yourself in the foot, but nobody can understand how you
> did it. Six months later, neither can you. | print 'aknerats'[::-1]
>
>
> On Tue, Aug 13, 2019 at 1:06 PM Petr Messner 
> wrote:
>
>> Jak jako vadný tag? Potom to není XML.
>>
>> Na HTML použij HTML parser.
>>
>> Petr Messner
>>
>> 13. 8. 2019 v 11:30, Ondrej Beranek :
>>
>> > Ahoj,
>> >
>> > když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
>> > předem neznámého obsahu, co na to použít ? Potřebuju aby se to
>> > nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
>> > Tak než začnu psát kolo...
>> >
>> > rainbof
>> >
>> > 13.08.19, Petr Messner :
>> >> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
>> >>
>> >> PM
>> >>
>> >> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek
>> >> > >
>> >> napsal:
>> >>
>> >>> Ahoj.
>> >>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
>> >>> Pro ty hodnoty, které jsou u > >>>
>> >>> from xml.dom import minidom
>> >>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
>> >>> streamlist = xmldoc.getElementsByTagName('stream')
>> >>> for s in streamlist:
>> >>>print(s.attributes['index'].value)
>> >>>print(s.attributes['codec_name'].value)
>> >>>try:
>> >>>print(s.attributes['sample_rate'].value)
>> >>>except:
>> >>>print('none')
>> >>>
>> >>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
>> >>> > >>> index="1"
>> >>>
>> >>> Mohli byste mi, prosím, poradit?
>> >>>
>> >>> Děkuji Ctibor
>> >>>
>> >>>
>> >>>
>> >>>
>> >>> ___
>> >>> Python mailing list
>> >>> python@py.cz
>> >>> http://www.py.cz/mailman/listinfo/python
>> >>>
>> >>> Visit: http://www.py.cz
>> >>>
>> >>
>> > ___
>> > Python mailing list
>> > python@py.cz
>> > http://www.py.cz/mailman/listinfo/python
>> >
>> > Visit: http://www.py.cz
>> ___
>> Python mailing list
>> python@py.cz
>> http://www.py.cz/mailman/listinfo/python
>>
>> Visit: http://www.py.cz
>>
>
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

2019-08-13 Tema obsahu starenka .

tak spatny xml se obcas prihodi, kdyz to nejakej jouda generuje nejak
obskurne, nebo se ti usekne stream nebo nevimcoeste lxml ucrite umi
podoktorovat html, mozna i xml
---
In Perl you shoot yourself in the foot, but nobody can understand how you
did it. Six months later, neither can you. | print 'aknerats'[::-1]


On Tue, Aug 13, 2019 at 1:06 PM Petr Messner  wrote:

> Jak jako vadný tag? Potom to není XML.
>
> Na HTML použij HTML parser.
>
> Petr Messner
>
> 13. 8. 2019 v 11:30, Ondrej Beranek :
>
> > Ahoj,
> >
> > když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
> > předem neznámého obsahu, co na to použít ? Potřebuju aby se to
> > nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
> > Tak než začnu psát kolo...
> >
> > rainbof
> >
> > 13.08.19, Petr Messner :
> >> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
> >>
> >> PM
> >>
> >> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek  >
> >> napsal:
> >>
> >>> Ahoj.
> >>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
> >>> Pro ty hodnoty, které jsou u  >>>
> >>> from xml.dom import minidom
> >>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
> >>> streamlist = xmldoc.getElementsByTagName('stream')
> >>> for s in streamlist:
> >>>print(s.attributes['index'].value)
> >>>print(s.attributes['codec_name'].value)
> >>>try:
> >>>print(s.attributes['sample_rate'].value)
> >>>except:
> >>>print('none')
> >>>
> >>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
> >>>  >>>
> >>> Mohli byste mi, prosím, poradit?
> >>>
> >>> Děkuji Ctibor
> >>>
> >>>
> >>>
> >>>
> >>> ___
> >>> Python mailing list
> >>> python@py.cz
> >>> http://www.py.cz/mailman/listinfo/python
> >>>
> >>> Visit: http://www.py.cz
> >>>
> >>
> > ___
> > Python mailing list
> > python@py.cz
> > http://www.py.cz/mailman/listinfo/python
> >
> > Visit: http://www.py.cz
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
>
> Visit: http://www.py.cz
>
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

2019-08-13 Tema obsahu Petr Messner

Jak jako vadný tag? Potom to není XML.

Na HTML použij HTML parser. 

Petr Messner

13. 8. 2019 v 11:30, Ondrej Beranek :

> Ahoj,
> 
> když jste to tu tak nakousli, když bych chtěl zpracovávat xml streamy
> předem neznámého obsahu, co na to použít ? Potřebuju aby se to
> nesložilo když přijde nějaký vadný tag abych měl šanci si to ošetřit.
> Tak než začnu psát kolo...
> 
> rainbof
> 
> 13.08.19, Petr Messner :
>> V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.
>> 
>> PM
>> 
>> út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek 
>> napsal:
>> 
>>> Ahoj.
>>> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
>>> Pro ty hodnoty, které jsou u >> 
>>> from xml.dom import minidom
>>> xmldoc = minidom.parse('RainS02E06.mkv.xml')
>>> streamlist = xmldoc.getElementsByTagName('stream')
>>> for s in streamlist:
>>>print(s.attributes['index'].value)
>>>print(s.attributes['codec_name'].value)
>>>try:
>>>print(s.attributes['sample_rate'].value)
>>>except:
>>>print('none')
>>> 
>>> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
>>> >> 
>>> Mohli byste mi, prosím, poradit?
>>> 
>>> Děkuji Ctibor
>>> 
>>> 
>>> 
>>> 
>>> ___
>>> Python mailing list
>>> python@py.cz
>>> http://www.py.cz/mailman/listinfo/python
>>> 
>>> Visit: http://www.py.cz
>>> 
>> 
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
> 
> Visit: http://www.py.cz
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

2019-08-13 Tema obsahu Petr Messner

V těchto případech je asi nejednodušší xpath. Minimálně lxml ho umí.

PM

út 13. 8. 2019 v 8:22 odesílatel Ctibor.Plasek 
napsal:

> Ahoj.
> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
> Pro ty hodnoty, které jsou u 
> from xml.dom import minidom
> xmldoc = minidom.parse('RainS02E06.mkv.xml')
> streamlist = xmldoc.getElementsByTagName('stream')
> for s in streamlist:
> print(s.attributes['index'].value)
> print(s.attributes['codec_name'].value)
> try:
> print(s.attributes['sample_rate'].value)
> except:
> print('none')
>
> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
> 
> Mohli byste mi, prosím, poradit?
>
> Děkuji Ctibor
>
>
>
>
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
>
> Visit: http://www.py.cz
>
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

2019-08-13 Tema obsahu starenka .

import json

with open('/cesta/k/soboru') as jf:
  data = json.load(jf)
  print(data)

Hotovo :)

---
aknerats[::-1]

On Tue, Aug 13, 2019, 08:32 Ctibor.Plasek  wrote:

> jj, to byl první pokus exportovat jako json
> ale tam jsem už vůbec nevěděl, co s tím :-(
>
>
> -- Původní e-mail --
> Od: starenka . 
> Komu: Konference PyCZ 
> Datum: 13. 8. 2019 8:26:22
> Předmět: Re: [python] xml parsování
>
> Cau, me to xml na telfonu nejde zobrazit, ale pro sichr. Vis, ze z ffprobe
> to de dostat taky jako json? Ten "naparsujes" bez namahy.
>
> s
>
> ---
> aknerats[::-1]
>
> On Tue, Aug 13, 2019, 08:22 Ctibor.Plasek  wrote:
>
> Ahoj.
> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
> Pro ty hodnoty, které jsou u 
> from xml.dom import minidom
> xmldoc = minidom.parse('RainS02E06.mkv.xml')
> streamlist = xmldoc.getElementsByTagName('stream')
> for s in streamlist:
> print(s.attributes['index'].value)
> print(s.attributes['codec_name'].value)
> try:
> print(s.attributes['sample_rate'].value)
> except:
> print('none')
>
> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
> 
> Mohli byste mi, prosím, poradit?
>
> Děkuji Ctibor
>
>
>
>
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
>
> Visit: http://www.py.cz
>
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
>
> Visit: http://www.py.cz
>
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
>
> Visit: http://www.py.cz
>
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

2019-08-13 Tema obsahu Ctibor.Plasek

jj, to byl první pokus exportovat jako json
ale tam jsem už vůbec nevěděl, co s tím :-(





-- Původní e-mail --
Od: starenka . 
Komu: Konference PyCZ 
Datum: 13. 8. 2019 8:26:22
Předmět: Re: [python] xml parsování
"
Cau, me to xml na telfonu nejde zobrazit, ale pro sichr. Vis, ze z ffprobe
to de dostat taky jako json? Ten "naparsujes" bez namahy.



s


---
aknerats[::-1]





On Tue, Aug 13, 2019, 08:22 Ctibor.Plasek mailto:ctibor.pla...@seznam.cz)> wrote:

"
Ahoj.
Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe. 

Pro ty hodnoty, které jsou u mailto:python@py.cz)
http://www.py.cz/mailman/listinfo/python
(http://www.py.cz/mailman/listinfo/python)

Visit: http://www.py.cz(http://www.py.cz)
"
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz
"
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

2019-08-13 Tema obsahu starenka .

Cau, me to xml na telfonu nejde zobrazit, ale pro sichr. Vis, ze z ffprobe
to de dostat taky jako json? Ten "naparsujes" bez namahy.

s

---
aknerats[::-1]

On Tue, Aug 13, 2019, 08:22 Ctibor.Plasek  wrote:

> Ahoj.
> Mám takovýto xml soubor (viz.přiložený soubor)  - export z ffprobe.
> Pro ty hodnoty, které jsou u 
> from xml.dom import minidom
> xmldoc = minidom.parse('RainS02E06.mkv.xml')
> streamlist = xmldoc.getElementsByTagName('stream')
> for s in streamlist:
> print(s.attributes['index'].value)
> print(s.attributes['codec_name'].value)
> try:
> print(s.attributes['sample_rate'].value)
> except:
> print('none')
>
> ale nevím jakým způsobem se dostat k těm "hlubším" hodnotám - např.
> 
> Mohli byste mi, prosím, poradit?
>
> Děkuji Ctibor
>
>
>
>
> ___
> Python mailing list
> python@py.cz
> http://www.py.cz/mailman/listinfo/python
>
> Visit: http://www.py.cz
>
___
Python mailing list
python@py.cz
http://www.py.cz/mailman/listinfo/python

Visit: http://www.py.cz

Re: [python] xml parsování

Re: [python] xml parsování

Re: [python] xml parsování

Re: [python] xml parsování

Re: [python] xml parsování

Re: [python] xml parsování

Re: [python] xml parsování

Re: [python] xml parsování

8 matches

Site Navigation

Mail list logo

Footer information