ข้อความที่ต้องการตรวจสอบ

ระบบจะค้นหาอักขระซ่อน เช่น Zero Width Space (U+200B), BOM (U+FEFF), NBSP (U+00A0) และตัวควบคุมอื่นๆ

สรุปผล

รายการอักขระที่พบ

ชนิด	อักขระ	Unicode	ตำแหน่ง	บริบท

ยังไม่พบอักขระซ่อน

Hidden Text Finder — ตรวจจับอักขระซ่อนที่มองไม่เห็น

Hidden Text Finder เป็นเครื่องมือที่ช่วยค้นหาและแสดงอักขระ Unicode ที่ซ่อนอยู่ในข้อความ ซึ่งมองไม่เห็นด้วยตาเปล่าแต่มีอยู่จริงใน string และอาจทำให้เกิดปัญหาในการประมวลผลข้อมูล อักขระเหล่านี้มักเกิดจากการ copy-paste จากแหล่งต่างๆ เช่น PDF, Microsoft Word, เว็บไซต์ หรือแอปพลิเคชัน chat

อักขระซ่อนที่พบบ่อยที่สุด

Zero Width Space (U+200B): ช่องว่างที่มองไม่เห็นซึ่งมักแทรกเข้ามาจาก web editor และระบบ CMS บางประเภท ทำให้คำดูเหมือนติดกันแต่จริงๆ มีอักขระแฝงอยู่

Non-Breaking Space (U+00A0): ดูเหมือนช่องว่างปกติแต่มี code point ต่างกัน ทำให้ str.split(" ") ไม่ตัดคำในจุดนี้ พบบ่อยมากในข้อความที่ copy จาก Word หรือ Wikipedia

BOM — Byte Order Mark (U+FEFF): มักอยู่ที่ต้นไฟล์ UTF-8 ที่บันทึกจาก Windows Notepad ทำให้ JSON parse error หรือ HTTP header ผิดรูปแบบ

Zero Width Joiner (U+200D): ใช้ใน emoji compound เช่น family emoji แต่เมื่อแทรกในข้อความธรรมดาอาจทำให้ regex ทำงานผิดพลาด

Soft Hyphen (U+00AD): เส้นขีดที่มองไม่เห็นที่บางระบบใช้ระบุจุดตัดคำ พบในเนื้อหาที่ copy จาก e-book หรือ PDF

Left-to-Right Mark (U+200E) / Right-to-Left Mark (U+200F): อักขระควบคุมทิศทาง text ที่อาจทำให้ UI แสดงผลผิดพลาดในระบบที่รองรับ bidirectional text

ปัญหาจริงที่เกิดจากอักขระซ่อน

ปัญหาเหล่านี้พบได้ในงานพัฒนาซอฟต์แวร์จริง:

Regex ทำงานผิดพลาด: Pattern /^\w+$/ ที่ควร match คำเดียวอาจ fail เพราะมี Zero Width Space แทรกอยู่กลางคำ

String comparison ล้มเหลว: "hello" === "hello" อาจ return false ถ้าหนึ่งในสองมี invisible character แทรกอยู่

Database unique constraint: User สมัครสมาชิกด้วย email [email protected] กับ user@example.com (มี ZWS) ระบบอาจมองเป็นคนละคนหรือเป็นคนเดียวกัน ขึ้นอยู่กับ collation

API token หรือ secret key: copy API key จากหน้าเว็บแล้วนำมาใช้ใน code แต่ authentication ล้มเหลวเพราะมี invisible character ติดมาด้วย

CSV import error: ข้อมูลดูถูกต้องแต่ import ผิดพลาดเพราะมี BOM ที่ต้นไฟล์ทำให้ header column ชื่อแรกผิดรูปแบบ

วิธีใช้งาน Hidden Text Finder

วางข้อความที่ต้องการตรวจสอบลงในช่อง input

กดปุ่ม "ตรวจสอบข้อความ" ระบบจะแสดงรายการอักขระซ่อนทั้งหมดพร้อม Unicode code point และตำแหน่งที่พบ

หากต้องการลบอักขระซ่อนทั้งหมดออก กดปุ่ม "ล้างอักขระซ่อน" จะได้ข้อความสะอาดที่สามารถ copy ไปใช้ได้ทันที

ใช้ปุ่ม "ใส่ตัวอย่าง" เพื่อดูตัวอย่างว่าอักขระซ่อนหน้าตาเป็นอย่างไรในตาราง

วิธีป้องกันปัญหาอักขระซ่อนในระบบ

สำหรับ User Input: sanitize ข้อความที่รับจากผู้ใช้ที่ฝั่ง server เสมอ เช่นใช้ text.replace(/[-‍‎‏]/g, '') ใน JavaScript

สำหรับ CSV/Excel import: บันทึกไฟล์เป็น UTF-8 without BOM เสมอ หรือตรวจสอบ BOM ที่ต้นไฟล์ก่อน process

สำหรับ Content จาก CMS: ใช้ library sanitization เช่น DOMPurify สำหรับ HTML หรือ strip invisible chars สำหรับ plain text

ใน Python: ใช้ unicodedata.category(char) ตรวจสอบว่าอักขระอยู่ใน category "Cf" (Format characters) ซึ่งครอบคลุม invisible chars ส่วนใหญ่

คำถามที่พบบ่อย — Hidden Text Finder

Zero-width characters คืออะไร?

Zero-width characters คืออักขระ Unicode ที่มองไม่เห็นด้วยตาเปล่าแต่มีอยู่จริงในข้อความ ตัวอย่างที่พบบ่อย ได้แก่ Zero Width Space (U+200B), Zero Width Non-Joiner (U+200C), Zero Width Joiner (U+200D) และ BOM (U+FEFF) อักขระเหล่านี้มักถูกแทรกโดยโปรแกรมประมวลผลคำ เว็บไซต์ หรือผู้ไม่หวังดีที่ต้องการซ่อนข้อความหรือ fingerprint ข้อมูล

ทำไมข้อความดูเหมือนกัน แต่ paste แล้วไม่ match กัน?

ปัญหานี้มักเกิดจากอักขระซ่อนที่แฝงอยู่ในข้อความ เช่น Zero-width space หรือ Non-breaking space (U+00A0) ที่ดูเหมือนช่องว่างปกติแต่มี Unicode code point ต่างกัน นอกจากนี้ยังอาจเกิดจากตัวอักษรที่มีรูปร่างเหมือนกันแต่เป็น Unicode ต่างตัว เช่น a ภาษาอังกฤษกับ а ภาษาซีริลลิก เครื่องมือนี้ช่วยตรวจจับและแสดง code point ที่แท้จริงของแต่ละอักขระ

Hidden characters ส่งผลต่อ SEO อย่างไร?

อักขระซ่อนในเนื้อหาเว็บส่งผลเสียต่อ SEO หลายประการ เช่น Google อาจอ่านคำ keyword ผิดเพราะมีอักขระแปลกแทรกอยู่, เนื้อหาที่คัดลอกมาจากเอกสาร Word หรือ PDF มักมีอักขระควบคุม (control characters) ที่ทำให้ indexing ผิดพลาด และอาจทำให้เนื้อหาถูกมองว่าเป็น duplicate content ควรทำความสะอาดข้อความก่อนเผยแพร่บนเว็บเสมอ

วิธีลบ invisible characters ออกจากข้อความ?

มีหลายวิธีลบอักขระมองไม่เห็นออกจากข้อความ เช่น ใช้เครื่องมือนี้กดปุ่ม "ล้างอักขระซ่อน" เพื่อลบอัตโนมัติ, ใช้ regular expression เช่น /[\u200B-\u200D\uFEFF]/g ใน JavaScript, หรือ paste ผ่าน Notepad แล้ว copy ใหม่เพื่อกรองอักขระบางประเภท สำหรับข้อมูลจาก API หรือ user input ควร sanitize ข้อมูลที่ฝั่ง server ด้วย