Discussion:
Gedit i polski man bash - kodowanie.
(Wiadomość utworzona zbyt dawno temu. Odpowiedź niemożliwa.)
Yukiai01
2007-12-25 20:01:11 UTC
Permalink
Witam.

W konsoli robię tak:

$ man bash

i wszystko jest OK, polskie znaki są wyświetlane dobrze. Następnie robię
tak:

$ man bash > plik1
$ gedit plik1

i zamiast polskich liter mam jakieś kwadraciki. A w mcedit mam jedną
kropkę przed wszystkimi dużymi literami Ł.

Gdy robię tak:

$ file plik1
plik1: Non-ISO extended-ASCII English text, with LF, NEL line terminators

Co to za kodowanie?

W systemie mam UTF-8 i chciałbym wyświetlić plik1 w gedit bez krzaczków,
za to z polskimi literami.
Próbowałem zmienić kodowanie pliku plik1 na UTF-8 za pomocą iconv,
używając różnych kodowań wejściowych, ale wyświetlał mi że "Błędna
sekwencja wejściowa na pozycji 128".

Czy wy też tak macie?
Jak zrobić, żeby gedit wyświetlał plik1 poprawnie?

Pozdrawiam,
Yuki, moe-like girl.
kolesdz
2007-12-25 22:22:07 UTC
Permalink
Post by Yukiai01
Witam.
$ man bash
i wszystko jest OK, polskie znaki są wyświetlane dobrze. Następnie robię
$ man bash > plik1
$ gedit plik1
i zamiast polskich liter mam jakieś kwadraciki. A w mcedit mam jedną
kropkę przed wszystkimi dużymi literami Ł.
$ file plik1
plik1: Non-ISO extended-ASCII English text, with LF, NEL line terminators
Co to za kodowanie?
W systemie mam UTF-8 i chciałbym wyświetlić plik1 w gedit bez krzaczków,
za to z polskimi literami.
Próbowałem zmienić kodowanie pliku plik1 na UTF-8 za pomocą iconv,
używając różnych kodowań wejściowych, ale wyświetlał mi że "Błędna
sekwencja wejściowa na pozycji 128".
Czy wy też tak macie?
Jak zrobić, żeby gedit wyświetlał plik1 poprawnie?
Pozdrawiam,
Yuki, moe-like girl.
1. Otwierając plik w gedit jest opcja automatycznego rozpoznawania kodowania
lub wyboru ręcznego.
2. Dobrze się zastanów jakie kodowanie będzie dla Ciebie najlepsze.
Odpowiedź nie jest prosta.
pozdrawiam
Jacek
Yukiai01
2007-12-25 22:55:42 UTC
Permalink
Post by kolesdz
1. Otwierając plik w gedit jest opcja automatycznego rozpoznawania kodowania
lub wyboru ręcznego.
2. Dobrze się zastanów jakie kodowanie będzie dla Ciebie najlepsze.
Odpowiedź nie jest prosta.
pozdrawiam
Jacek
Witaj.

Niestety to nic nie daje. Przy próbach otwarcia pliku z różnymi
kodowaniami w gedit albo były krzaczki, albo w ogóle nie mógł go otworzyć.
kolesdz
2007-12-26 00:22:06 UTC
Permalink
Post by Yukiai01
Post by kolesdz
1. Otwierając plik w gedit jest opcja automatycznego rozpoznawania kodowania
lub wyboru ręcznego.
2. Dobrze się zastanów jakie kodowanie będzie dla Ciebie najlepsze.
Odpowiedź nie jest prosta.
pozdrawiam
Jacek
Witaj.
Niestety to nic nie daje. Przy próbach otwarcia pliku z różnymi
kodowaniami w gedit albo były krzaczki, albo w ogóle nie mógł go otworzyć.
Nie może otworzyć? A co pisze?
Jakiego masz Linuksa? Jakiego managera? Czy robiłeś coś z kodowaniem?
Właściwie to napisałeś ale potwierdź. Masz ustawione UTF-8 a manuale są
po polsku?
Jakie jest domyślne kodowanie w gnome-terminalu?
J.
Yukiai01
2007-12-26 07:30:13 UTC
Permalink
Post by kolesdz
Nie może otworzyć? A co pisze?
Albo otwiera, albo nie, zależy to od kodowania które wybrałem, a
spróbowałem wszystkie dostępne. Jak otworzył to były krzaczki, a jak
nie, to pisał komunikat: Nie można otworzyć pliku plik1 przy użyciu
kodowania znaków "jakieś wybrane kodowanie"
Post by kolesdz
Jakiego masz Linuksa?
Debian Sid i się tak zastanawiam, czy to jest przez to że co jakiś czas
aktualizuję go. Bo jak wiadomo, w Sid nie wszystko może działać poprawnie.
Post by kolesdz
Jakiego managera?
Metacity.
Post by kolesdz
Czy robiłeś coś z kodowaniem?
Nie.
Post by kolesdz
Właściwie to napisałeś ale potwierdź. Masz ustawione UTF-8 a manuale są
po polsku?
Tak, ale nie wszystkie, niektóre są po angielsku :).
Post by kolesdz
Jakie jest domyślne kodowanie w gnome-terminalu?
Oooo. A jak to sprawdzić?
Chyba jest takie jak w całym GNOME, czyli UTF-8.

Spróbuje coś pokombinować.
Grzegorz G
2007-12-26 10:00:30 UTC
Permalink
Post by Yukiai01
Witam.
$ man bash
i wszystko jest OK, polskie znaki są wyświetlane dobrze. Następnie robię
$ man bash > plik1
$ gedit plik1
i zamiast polskich liter mam jakieś kwadraciki. A w mcedit mam jedną
kropkę przed wszystkimi dużymi literami Ł.
ciach
Potwierdzam, gorzej, na stable jest tak samo.
Post by Yukiai01
Czy wy też tak macie?
Jak zrobić, żeby gedit wyświetlał plik1 poprawnie?
skoro na stable jest tak samo to znak ze coś robimy źle, jak znajdę
rozwiązanie dam znać.
--
G.
Yukiai01
2007-12-26 13:39:01 UTC
Permalink
Post by Yukiai01
Witam.
$ man bash
i wszystko jest OK, polskie znaki są wyświetlane dobrze. Następnie robię
$ man bash > plik1
$ gedit plik1
i zamiast polskich liter mam jakieś kwadraciki. A w mcedit mam jedną
kropkę przed wszystkimi dużymi literami Ł.
Próbowałem skonwertować man basha do pliku tekstowego za pomocą tego:
$ man bash | col -b > plik2

ale to kompletnie wycina polskie znaki.

Wygląda na to że wykonując man bash > plik1 , cały ten tekst jest jakoś
wewnętrznie przetwarzany przy użyciu jakiegoś wewnętrznego kodowania -
tylko jakie dokładnie jest to kodowanie?
Nie wiem jak to sprawdzić.

Ale to dziwne.
Jacek Maciejewski
2007-12-26 18:29:17 UTC
Permalink
Post by Yukiai01
Wygląda na to że wykonując man bash > plik1 , cały ten tekst jest jakoś
wewnętrznie przetwarzany przy użyciu jakiegoś wewnętrznego kodowania -
tylko jakie dokładnie jest to kodowanie?
Zgaduję, ale pewnie ASCII, jak cały bash. Może jakbyś korzystał z innego
shella... Ale to już poza moim rozumieniem :)
--
Jacek
kolesdz
2007-12-27 03:19:16 UTC
Permalink
Post by Jacek Maciejewski
Post by Yukiai01
Wygląda na to że wykonując man bash > plik1 , cały ten tekst jest jakoś
wewnętrznie przetwarzany przy użyciu jakiegoś wewnętrznego kodowania -
tylko jakie dokładnie jest to kodowanie?
Zgaduję, ale pewnie ASCII, jak cały bash. Może jakbyś korzystał z innego
shella... Ale to już poza moim rozumieniem :)
Chyba słabo zgadujesz bo z opisu wynika, że korzysta z sh
Yukiai01
2007-12-28 15:59:42 UTC
Permalink
Post by kolesdz
Chyba słabo zgadujesz bo z opisu wynika, że korzysta z sh
Witam ponownie.
Tak się składa że korzystam z basha, ale sprawdzałem też pod sh i to samo.
kolesdz
2007-12-27 03:05:32 UTC
Permalink
Post by Yukiai01
Witam.
$ man bash
i wszystko jest OK, polskie znaki są wyświetlane dobrze. Następnie robię
$ man bash > plik1
$ gedit plik1
i zamiast polskich liter mam jakieś kwadraciki. A w mcedit mam jedną
kropkę przed wszystkimi dużymi literami Ł.
$ file plik1
plik1: Non-ISO extended-ASCII English text, with LF, NEL line terminators
Co to za kodowanie?
W systemie mam UTF-8 i chciałbym wyświetlić plik1 w gedit bez krzaczków,
za to z polskimi literami.
Próbowałem zmienić kodowanie pliku plik1 na UTF-8 za pomocą iconv,
używając różnych kodowań wejściowych, ale wyświetlał mi że "Błędna
sekwencja wejściowa na pozycji 128".
Czy wy też tak macie?
Jak zrobić, żeby gedit wyświetlał plik1 poprawnie?
Pozdrawiam,
Yuki, moe-like girl.
OK. Moja rada jest taka.
Zrób sobie rewolucję i przejdź na ISO-8859-2.
Wszystko co zrobisz można cofnąć.

#apt-get install cabextract msttcorefonts
zrób sobie wszędzie czcionkę Verdana a w terminalu Courier New
#apt-get install fonty
#dpkg-reconfigure locales (wybierasz tylko polskie iso)
#dpkg-reconfigure fonty (wybierasz iso)
#dpkg-reconfigure console-data

Chyba wystarczy się wylogować ale Ty przeładuj system.
Otwórz terminal. Kliknij w pole klawiszem myszy i każ pokazać pasek menu.
Domyślne kodowanie wybrane na pasku powinno być iso-8859-2

mc powinno otwierać się bez krzaczków.
Obstawiam, że jeśli tak będzie Twoje problemy znikną jak za dotknięciem
czarnoksięskiej różdżki.
pozdr
Jacek

P.S. Jeśli w jakiejś aplikacji chcesz nadal używać utf-8 napisz.
To nie będzie problem. Ale help do basha jest w iso :).
Jak też inne helpy po polsku w Debianie.
kolesdz
2007-12-27 03:15:55 UTC
Permalink
Post by kolesdz
Post by Yukiai01
Witam.
$ man bash
i wszystko jest OK, polskie znaki są wyświetlane dobrze. Następnie
$ man bash > plik1
$ gedit plik1
i zamiast polskich liter mam jakieś kwadraciki. A w mcedit mam jedną
kropkę przed wszystkimi dużymi literami Ł.
$ file plik1
plik1: Non-ISO extended-ASCII English text, with LF, NEL line terminators
Co to za kodowanie?
W systemie mam UTF-8 i chciałbym wyświetlić plik1 w gedit bez
krzaczków, za to z polskimi literami.
Próbowałem zmienić kodowanie pliku plik1 na UTF-8 za pomocą iconv,
używając różnych kodowań wejściowych, ale wyświetlał mi że "Błędna
sekwencja wejściowa na pozycji 128".
Czy wy też tak macie?
Jak zrobić, żeby gedit wyświetlał plik1 poprawnie?
Pozdrawiam,
Yuki, moe-like girl.
OK. Moja rada jest taka.
Zrób sobie rewolucję i przejdź na ISO-8859-2.
Wszystko co zrobisz można cofnąć.
#apt-get install cabextract msttcorefonts
zrób sobie wszędzie czcionkę Verdana a w terminalu Courier New
#apt-get install fonty
#dpkg-reconfigure locales (wybierasz tylko polskie iso)
#dpkg-reconfigure fonty (wybierasz iso)
#dpkg-reconfigure console-data
Chyba wystarczy się wylogować ale Ty przeładuj system.
Otwórz terminal. Kliknij w pole klawiszem myszy i każ pokazać pasek menu.
Domyślne kodowanie wybrane na pasku powinno być iso-8859-2
mc powinno otwierać się bez krzaczków.
Obstawiam, że jeśli tak będzie Twoje problemy znikną jak za dotknięciem
czarnoksięskiej różdżki.
pozdr
Jacek
P.S. Jeśli w jakiejś aplikacji chcesz nadal używać utf-8 napisz.
To nie będzie problem. Ale help do basha jest w iso :).
Jak też inne helpy po polsku w Debianie.
No i jeszcze jedno.
gedit jest aplikacją z gnome.
Metacity możesz sobie mieć, ale jeśli chcesz aby gedit
działał poprawnie powinieneś mieć zainstalowane gnome.
I chyba zacznij od sprawdzenia czy w gnome też tak Ci się dzieje jak
metacity.
powodzenia - to wszystko się nie może nie udać
Jacek
Yukiai01
2007-12-28 16:24:02 UTC
Permalink
Post by kolesdz
Post by kolesdz
OK. Moja rada jest taka.
Zrób sobie rewolucję i przejdź na ISO-8859-2.
Wszystko co zrobisz można cofnąć.
<ciach>

Kiedyś za czasów Fedora Core (chyba 4 albo 6), zdecudowałem się na
UTF-8. Wolałbym żebu tak zostało :).
Post by kolesdz
Post by kolesdz
To nie będzie problem. Ale help do basha jest w iso :).
Jak też inne helpy po polsku w Debianie.
Czyli "file" mnie okłamał, tak?. A pisał że "Non-ISO extended-ASCII
English text, with LF, NEL line terminators".

No to skoro polskie helpy, many i inne takie są pisane w iso (ale jakie:
8859-2?), to by znaczyło że, wykonując w terminalu "man bash > plik1",
to kodowanie jest jakoś, gdzieś wewnętrznie zamieniane, na coś innego.
I skoro jest to iso, to czemu w gedit po wypróbowaniu wszystkich kodowań
(wszystkich dostępnych, nie tylko iso) otwiera mi plik1 z krzaczkami?

I najważniejsze, czemu "file" mnie okłamał?
Post by kolesdz
No i jeszcze jedno.
gedit jest aplikacją z gnome.
Metacity możesz sobie mieć, ale jeśli chcesz aby gedit
działał poprawnie powinieneś mieć zainstalowane gnome.
Tak się składa że mam GNOME.

A wcześniej pytałeś mi się, między innymi o to jakiego menedżera używam,
więc odpowiedziałem że metacity, bo to chyba jest menedżer okien i chyba
od wersji GNOME 2.2 jest domyślnym menedżerem, zamiast metacity. Ale tu
to ja się już czepiam szczegółów, bo mogłem wcześniej napisać że używam
GNOME. Ale nic to :).
Paweł Matejski
2007-12-28 17:07:06 UTC
Permalink
Post by Yukiai01
Post by kolesdz
To nie będzie problem. Ale help do basha jest w iso :).
Jak też inne helpy po polsku w Debianie.
Czyli "file" mnie okłamał, tak?. A pisał że "Non-ISO extended-ASCII
English text, with LF, NEL line terminators".
To coś masz nie tak:
***@mibm:~/tmp$ LC_ALL=pl_PL man bash > manbash; file manbash
manbash: ISO-8859 English text
***@mibm:~/tmp$ LC_ALL=pl_PL.UTF8 man bash > manbash; file manbash
manbash: UTF-8 Unicode English text

Gedit obydwa otwiera poprawnie.
Post by Yukiai01
8859-2?), to by znaczyło że, wykonując w terminalu "man bash > plik1",
to kodowanie jest jakoś, gdzieś wewnętrznie zamieniane, na coś innego.
No dokładnie.
Post by Yukiai01
I skoro jest to iso, to czemu w gedit po wypróbowaniu wszystkich kodowań
(wszystkich dostępnych, nie tylko iso) otwiera mi plik1 z krzaczkami?
Bo ten plik nie dość że nie jest w iso, to nie jest w niczym. Pewnie masz
sieczkę, która powstaje podczas konwersji z jednego kodowania na inny,
gdy podane kodowanie nie zgadza się z faktycznym.
Post by Yukiai01
I najważniejsze, czemu "file" mnie okłamał?
Raczej założyłbym, że file nie kłamie.
--
P.M.
Yukiai01
2007-12-28 18:32:06 UTC
Permalink
Chyba tak, bo jak przeszłem na iso to file mi pokazał że plik1 to
ISO-8859 English text
Ale gdy wróciłem na UTF-8, to dalej mam Non-ISO.

Być może coś jest skopane z locale, bo w końcu to Sid.

Pomyśle coś nad tym, a tymczasem dzięki za pomoc.
kolesdz
2007-12-29 02:03:37 UTC
Permalink
Post by Yukiai01
Chyba tak, bo jak przeszłem na iso to file mi pokazał że plik1 to
ISO-8859 English text
Ale gdy wróciłem na UTF-8, to dalej mam Non-ISO.
Być może coś jest skopane z locale, bo w końcu to Sid.
Pomyśle coś nad tym, a tymczasem dzięki za pomoc.
Ja korzystam z Ubuntu na stacjach roboczych i Etcha na serwerach.
Właściwie i w ISO i w UTF-8 to się kręci poprawnie. Ale kiedy
przechodzę na UTF-8 mam bardzo dużo tekstów po angielsku zamiast po polsku.
Dzieje się tak w wielu aplikacjach np manuale, squirrelmail, ...
Telefonia komórkowa chodzi w zasadzie na utf-8 ale aplikacje w Javie
przeważnie w iso. Chyba teraz nie ma idealnego rozwiązania.
Jest ewidentna presja na przejście na utf-8 ale niektórzy się nieźle
bronią.
Ty masz coś źle ale nie wiem gdzie więc zaproponowałem dużą zmianę.
Mam nadzieję, ż znajdziesz przyczynę.
pozdrawiam i trzymam kciuki
Jacek
Yukiai01
2007-12-30 16:44:01 UTC
Permalink
Post by kolesdz
Ja korzystam z Ubuntu na stacjach roboczych i Etcha na serwerach.
Właściwie i w ISO i w UTF-8 to się kręci poprawnie. Ale kiedy
przechodzę na UTF-8 mam bardzo dużo tekstów po angielsku zamiast po polsku.
Dzieje się tak w wielu aplikacjach np manuale, squirrelmail, ...
Telefonia komórkowa chodzi w zasadzie na utf-8 ale aplikacje w Javie
przeważnie w iso. Chyba teraz nie ma idealnego rozwiązania.
Jest ewidentna presja na przejście na utf-8 ale niektórzy się nieźle
bronią.
Ty masz coś źle ale nie wiem gdzie więc zaproponowałem dużą zmianę.
Mam nadzieję, ż znajdziesz przyczynę.
pozdrawiam i trzymam kciuki
Jacek
Witaj.

Poniewż mam Sid'a, więc zainstalowałem sobie debiana 40r0 pod qemu.
Okazało się, że tam nie ma problemów. Mogę mieć ISO albo UTF-8 i manual
basha jest przy obu ustawieniach po polsku. Co więcej, na UTF-8 wykonanie:
$ man bash > plik
$ gedit plik

gedit wyświetla poprawnie polskie znaczki, podobnie jak inne edytory,
nawet cat i head.

W etchu pakiet locales (bo to chyba z nim jest problem) ma wersję
2.3.6.ds1-13
a u mnie obecnie 2.7.5

Czyli poprostu w sid'zie zapewne z pakietem locales, jest coś nie tak.
Ale nie wiem co.
Yukiai01
2007-12-30 16:56:21 UTC
Permalink
Post by Yukiai01
Czyli poprostu w sid'zie zapewne z pakietem locales, jest coś nie tak.
Ale nie wiem co.
Niestety, to nie to, bo zrobiłem downgrade z 2.7.5 do 2.3.6.ds1-13 i
dalej to samo.
kolesdz
2007-12-31 19:24:35 UTC
Permalink
Post by Yukiai01
Post by Yukiai01
Czyli poprostu w sid'zie zapewne z pakietem locales, jest coś nie tak.
Ale nie wiem co.
Niestety, to nie to, bo zrobiłem downgrade z 2.7.5 do 2.3.6.ds1-13 i
dalej to samo.
Ja się bawię instalacją Ubuntu (podobno zgrubsza sid) na flash-romie
i mam podobne efekty jak Ty - odpalając FreePascala na tty kaszani się
strona kodowa
i tak już zostaje. Ale tak robi tylko FP, reszta zachowuje się
przyzwoicie w UTF-8.
Jeśli zmienię na ISO to w tty FP jest w krzaczki totalne.
Podczas otwarcia FP w terminalu w X-ach w obu przypadkach nic się nie
dzieje i jest OK.
Acha, czytając wątek widzę, że walnąłem nie na temat.
#dpkg-reconfigure console-common
a nie jak napisałem
#dpkg-reconfigure console-data

W Nowy Roku życzę aby w tty ... :)
Jacek

Loading...