Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Pracovní prostředí => Téma založeno: miro_ 26 Října 2018, 19:39:19

Název: Problem porovnani src. textu v 'meld'
Přispěvatel: miro_ 26 Října 2018, 19:39:19
Chtel jsem zjistit rozdily zdrojovych textu ale dockal jsem se neprijemneho prekvapeni.
Jiz jsem se s podobnym problemem drive setkat ale tenkrat jsem to v linuxu dale neresil.
Uzivam U16.04 a mam instalovan 'meld-3.14.2'.
Vysledek pocatku porovnani jsem zachytil do 'porovnani-v-meld-3.14.2.jpg'.
Pritom otevreni souboru v 'gedit' z prave strany je OK viz.  'pravy- soubor-v-gedit.jpg'.
Vi nekdo co s tim ?
Název: Re:Problem porovnani src. textu v 'meld'
Přispěvatel: juwa2 26 Října 2018, 20:45:48
https://www.scootersoftware.com/download.php
Název: Re:Problem porovnani src. textu v 'meld'
Přispěvatel: miro_ 12 Listopadu 2018, 11:04:49
Konecne jsem zkousel 'Beyond Compare 4'. Ten vyse uvedeny problem nema.
Vzhledem k cene licence je pro mne jeho uzivani nerealne.

Znovu jsem tedy zkousel 'Meld'. Zjistil jsem ze problem je zrejme v existenci 'neplatneho znaku' v souboru.
Pri zkouseni na pomalejsim pocitaci (bez ssd) bylo videt ze spusteni porovnani souboru
zpocatku zobrazuje testovany text normalne ale v zapeti se prepne do "čínštiny".
Jeslize takto se chovajici soubor natahnu do 'gedit' jsou zde indikovany 'neplatne znaky' viz. prilozeny snimek scr.
Ale jak je v 'gedit' najit ?
Prostredky na jejich likvidaci mam, pripadne umim vytvorit si pro korekci textu aplikaci.
Problem se tedy posouva do roviny najit pozice 'neplatnych znaku'. Zdrojovy text s kometari ma totiz 234kB.
Název: Re:Problem porovnani src. textu v 'meld'
Přispěvatel: TIBOR 12 Listopadu 2018, 11:29:05
V akom kodovani je ten subor? Nepomohlo by ho ulozit v UTF8/16.
Pripadne neskusal si porovnat tie subory prikazom diff?
Kód: [Vybrat]
diff subor1 subor2https://www.computerhope.com/unix/udiff.htm
Název: Re:Problem porovnani src. textu v 'meld'
Přispěvatel: miro_ 12 Listopadu 2018, 13:07:12
Se soubory je vetsinou manipulovano v editoru  'AVRstudiu' a 'PN' ve Win-XP.
Otestoval jsem vlozeni znaku 'šžů'. Dle vlozenych kodu by se melo jednat o kodovani Windows-1250.

Bohuzel se mi v techto XP nekdy stava, ze pri nekolika otevrenych aplikacich a presouvani/kopirovani
casti textu, ze kopirovana cast se vlozi jeste nekam jinam, kam to bylo urceno.
Z toho je zrejme, ze se tam muze objevit cokoli z hex kodu. Pokud se to stane v komentarich, tak to nezjistim.
Proto jsem se pokousel u nechodiciho projektu po upravach hledat zda tam nevnikl takto problem i v 'Meld',
ktery umoznuje kontroly bez kometaru atd.
Bohuzel s upravami AVR projektu, kvuli nepodpore mych starsich HW ladicich prostredku,
nejsem schopen se v soucasnosti jednoduse presunout na jiny OS.

Pri testovani s 'Beyond Compare 4' a nasledne 'Meld' jsem uzil soubory z poslednich zaloh projektu,
t.j. jiz jiny stav nez jsem zde v uvodu prezentoval. Zde byl nemyslny vypis (čínsky) pri porovnani
na jednom souboru se zmenami v obou verzich (v obou oknech Meld). Z puvodne presentovaneho souboru
'pst_temperture.c' tento problem, zrejme v dusledku uprav zmizel a lze jej otevrit v 'gedit' bez problemu.
Název: Re:Problem porovnani src. textu v 'meld' [Vyřešeno]
Přispěvatel: miro_ 13 Listopadu 2018, 21:21:34
Dnes jsem se vratil znovu k tomuto problemu. Vzhledem k tomu, ze normalne neuzivam cestinu,
tak se v src. textech psanych ve win aplikacich neobjevi problem. Obcas si do kometare kopiruji
z '.pdf' vysvetlujici texty a tak se mohly problematicke znaky s kodovani 1250 do nich dostat.
Reseni je, pred testovanim v 'meld' prekodovat soubory do UTF-8 nasledovne:

`iconv -f windows-1250 -t utf-8 <vstup >výstup'

Zajimave je, ze kdyz jsem zkusil na pocatek souboru zapsat v 1250 testovaci znaky 'šžů',
tak 'gedit' nic o jinem kodovani nehlasil ale zobrazi je viz. prilozeny scr..
Název: Re:Problem porovnani src. textu v 'meld' [Vyřešeno]
Přispěvatel: juwa2 14 Listopadu 2018, 08:09:33
Zajimave je, ze kdyz jsem zkusil na pocatek souboru zapsat v 1250 testovaci znaky 'šžů',
tak 'gedit' nic o jinem kodovani nehlasil ale zobrazi je viz. prilozeny scr..

Editory rozpoznávají kódování automaticky, některé lépe, jiné hůře ale spolehlivé to není nikdy. Nejjistější je do souboru zapsat bom. Pak je identifikace jednoznačná a soubor se otevře se správným kódováním = znaky nejsou zkomolené.