Windows 10 Insider Preview Build 18875 (20H1)
Sa episode 9 ng pangalawang panahon ng Log Horizon, nang ...
Namatay si Shiroe at lumitaw sa hindi opisyal na 14th server ni Elder Tale, ang server ng pagsubok, na itinakda na nasa Buwan sa halip na sa Lupa,
... sinuri niya ang lokasyon at ang diyalogo ay halos garbled up, nai-save para sa pangalan ng lokasyon Mare Tranquillitatis.
Maaari bang ma-decrypt ang na-garb na teksto, o simpleng basura lang ang mga ito?
Oo, ang garbled up na teksto ay resulta ng mojibake, kung saan ang orihinal na teksto sa Japanese, na naka-encode sa Shift-JIS encoding, ay na-decode ng Windows-1256 encoding.
Kung magbubukas ka man ng isang Japanese web page o text file na naka-encode sa Shift-JIS encoding (2-byte character set) sa ilalim ng ilang Western encoding sa Windows (1-byte character set), makikita mo ang mataas na dalas ng ��
ipinares sa ilang iba pang mga character sa nagresultang view. Dahil napansin ko na may mga character na Arabe sa imahe, ginamit ko ang isa sa aking umiiral na file ng teksto na naka-encode sa Shift-JIS at sinubukan akong buksan ito sa pag-encode ng Arabic (Windows) sa browser, at nalaman ko na ang Arabe (Windows) o ang Western encoding ay may parehong pagmamapa para sa ��
at ��
(na kung saan ay isa pang karaniwang karakter sa garbled up na teksto).
Matapos ihambing ang maayos na nai-render na window ng status ng lokasyon at ilang hula, nagawa kong i-decode ang garbled up na teksto sa tamang teksto ng Hapon (ang mga bracket na at ay idinagdag para sa kalinawan at hindi na-decode mula sa garbled up na teksto):
������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������
Pagsasalin:
Moon Server Moon Server Isolated zone/No monster PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted
Apendiks
Upang i-cross-check ang resulta, maaari mong gamitin ang sumusunod na piraso ng Python 3 code:
garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS'))
Nasa ibaba ang Tingnan lamang pinagmulan1 ng mojibake para sa paghahambing sa imahe:
1 Naglalaman ang teksto sa ibaba ng U + 200E Kaliwa-sa-Kanang Markahan upang maiwasan ang mga character na Arabe mula sa pag-render ng kanan-sa-kaliwa at binago ang kanilang mga hugis batay sa kanilang posisyon. Ang isa pang problema na pumipigil sa tuwid na pagkopya ay dahil sa pagkakaroon ng U + 00A0 No-Break Space, na na-convert sa puwang kapag nakopya mula sa browser.
�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/���������������������������������������������
1 - "Pinapayagan ang PvP": Huh. Nagtataka kung magtatapos iyon sa pagiging mahalaga.