Meta charset nedir?

Bir charset veya tam adıyla karakter seti, hesap makinesinin sayıları tanıyabildiği gibi bilgisayar tarafından tanınan bir karakterler topluluğudur. Bu karakterlerin her biri, kod noktası olarak bilinen bir sayı ile temsil edilir ve bu, içeriğin kodlanması ve kod çözülmesi için bir iletişim kanalı oluşturur.

Bir karakter seti, bu nedenle, belirli bir amaç için hizmet eden karakterler içerir. Bilgisayar, karakterleri bir veya daha fazla bayt olarak saklar. Örneğin, ASCII karakter seti tüm İngilizce karakterleri ve özel kontrol karakterlerini 0-127 arasındaki sayılarla temsil eder.

Yine de, çoğu karakter seti sadece belirli diller için çalışır ve sınırlı karakterleri tanır ve bu, kodlamanın ve kod çözmenin zor veya imkansız olmasına neden olur. Ancak modern zamanlarda, Unicode kolayca kodları ve sayıları çevirebilme yeteneği nedeniyle en güvenilir ve evrensel olarak kabul edilen karakter setidir.

Html kodunuzun başlığında meta charset'i görebilirsiniz

<meta charset="utf-8">

Nasıl çalışır?

Meta Charset, metnin nasıl iletilip saklandığını belirleyen şeydir. Bu metin verisi genellikle önce ikiliye (binary) dönüştürülür ve ardından karakterlerin doğru ikili eşdeğerleriyle bağlantı kuracak bir tür şifre olması gerekir.

Bu veriler sonunda çözüldüğünde, karakter kodlaması önceden bilinmelidir yoksa sorunlar yaşanabilir. Bunun örnekleri, bir web sayfasına baktığınızda tarayıcılarda görülebilir. Kullanılan karakter seti hakkındaki bilgiler sunucudan gelir veya doğrudan geliştirici tarafından yazılır. Ne yazık ki, çok sayıda karakter seti bulunmakta ve bu da ikili kodların karakterlere ve baytlara çeşitli şekillerde eşlenmesi anlamına gelmektedir.

İçerik geliştiricileri ve yazarlar için, içeriğiniz için UTF-8 karakter setini seçmek, birden fazla karakter ihtiyacını karşılamak için tek bir karakter seti kullanabileceğiniz anlamına gelir ve böylece, birden fazla kez takip etme ve dönüştürme ihtiyacı olmadan işleri büyük ölçüde basitleştirir. Bu, içeriğinizde karışık karakterler ve anlamsız metinlerle karşılaşmadan rahatça gezinmenizi kolaylaştırır demektir

AddType 'text/html; charset=UTF-8' html

Neden önemli?

Her bir metin iletilirken belirli bir karakter setinde kodlanması ve diğer tarafta dekod edilmesi gerektiği düşünüldüğünde, karakter setinin önemi oldukça açıktır. Bu, uygun karakter kodlaması olmadan, bir tarayıcının çöp metin göstereceği anlamına gelir çünkü sadece içine ne konulduğunu anlamaz ve hızlıca bilinçsiz bir tahmin yapmak zorunda kalır.

Html formlarında da önemlidir çünkü sitelerde veya sosyal medya platformlarında metin kutularına metin girdiğinizde, bu dikkatlice kodlanmalıdır. Eğer bu bilgi herhangi bir nedenle mevcut değilse, yanlış eşleme hayati bilgilerin kaybına yol açabilir.

Charset kod örneği

Karakter setinin yaptığı şey, kullanıcı ile web sitesi arasında geçen kodu açmak ve çözmek için bir anahtar sağlamaktır.

Bilgisayardaki baytlar ile karakter setindeki karakterler arasında yapılandırılmış eşlemeler kümesidir. Bu anahtar eksikse, veriler yazılmış çöp gibi görünür. Bu, bir klavye aracılığıyla metin girdiğinizde, karakter setinin seçtiğiniz karakterleri bilgisayar hafızasındaki belirli baytlarla bağlantılandırdığı ve ardından metni görüntülemek için baytları geri karakterlere dönüştürdüğü anlamına gelir.

SEO için bir sıralama faktörü mü?

Karakter seti, arama motoru optimizasyonu için bir sıralama faktörü değildir. Çoğu arama motoru, arayanlara alakalı, faydalı içerik sunma gibi önemli bir hedefe odaklanır ve bu hedefe katkıda bulunmayan diğer dış faktörleri göz önünde bulundurmaz.

Karakter setiniz önemlidir çünkü bilgiyi nasıl ilettiğinizle ilgilidir ancak arama motorları bununla ilgilenmez. Utf-8 dışında başka charsetler kullanmak SEO sıralamanızı düşürmez çünkü büyük ölçüde hangi karakter kodlamasını kullandığınız önemli değildir, sürece arama motoru bilgiyi son kullanıcılara ulaştırabiliyorsa.

Eğer ihtiyacım olursa nasıl ekleyebilirim?

Web sitenize aşağıdaki kodu kullanarak bir karakter seti ekleyebilirsiniz

<?phpheader( Content-Type: text/html; charset=iso-8859-1’)

Bunun işe yaraması için, html dosyanızı içeren PHP'ye bunu eklemelisiniz. Yukarıdaki kodun bir fonksiyon değil, bir ifade olduğunu ve bu nedenle tüm web sayfalarında çalışmayabileceğini belirtmek önemlidir, bu yüzden sayfa html'nizi eklemelisiniz. PHP web sayfasının başlığında Utf-8 karakter seti kullandığını göz önünde bulundurarak.

Farklı türdeki karakter setleri

Çoğu karakter seti, bireysel üreticilerin müşterilerinin ihtiyaçlarına göre ortaya çıkmıştır. Çoğu karakter seti birbiriyle uyumsuzdur (birkaç istisna dışında). En yaygın üç karakter seti, ASCII (1968), ISO 8859-1 (1987) ve UTF-8 (1996).

ASCII

İngilizce dil karakter seti. 7-bitlik bir yapıya sahip olup, 128 karaktere eşlenmiştir. Her harfe 0'dan 127'ye kadar bir numara atanmıştır. Bu kod seti oldukça sınırlıdır, ancak öncülerden biri olması diğer diller için bir karakter seti oluşturulmasını tetiklemiştir. Çoğu bilgisayar, metni temsil etmek için ASCII kodlarını kullanır.

ascii karakter seti tablosu

Unicode

Unicode, 135 modern ve tarihi dili tek bir standart altında birleştirmek için oluşturuldu. Unicode, kendisi bir karakter seti değil, bir standarttır. Mayıs 2019 itibarıyla, 12.1 sürümü, Unicode 137,994 karakter içermekte olup semboller ve emojileri de kapsar. Unicode standardı UTF-8, UTF-16 ve UTF-32'yi tanımlar

UTF-8

Şimdi internetin hakim kodlaması. UTF-8, web sitelerinin %94'ünde kullanılıyor. En yaygın karakterleri, temel sayıları ve İngilizce'yi 8-bit ile kodlar. UTF-8 en az 1 bayt kullanır. UTF-8, İngilizce için ASCII ile de aynıdır. Bu, herhangi bir ASCII metnin aynı zamanda bir UTF-8 metni olduğu anlamına gelir.

UTF-8 karakter seti kod örneği

Resim Kaynağı

UTF-16

Unicode 16 bit ile. Başlangıçta Windows ve Java gibi sistemlerle kullanılmış olsa da, Linux ve macOS ile gerçekten popüler olmadı. Bugün UTF-16, web sayfalarının %0.01'inde kullanılıyor. UTF-16 en az 2 bayt kullanır.

UTF-16 Unicode karakter seti örneği

Resim Kaynağı

UTF-32

32 bitlik Unicode. UTF-32'nin avantajı, Unicode noktalarının doğrudan indekslenmesidir. Dezavantajı ise her zaman 4 bayt kullanması nedeniyle alan kullanımının verimli olmamasıdır. Bu, UTF-16'nın iki katı ve UTF-8'in dört katı kadar bir boyut anlamına gelir.

Sonuç olarak

Charset'ın SEO faydaları nelerdir? Doğrudan bir sıralama faktörü olmasa da, charset'inizden haberdar olmanız gerekecek. Eğer yanlışlıkla meta charset'inizde 2 farklı standardı gösterirseniz veya standartların kurallarını doğru bir şekilde takip etmezseniz, bir kod çözme sorunu yaşayacaksınız ve içeriğiniz doğru bir şekilde görüntülenmeyecek. Bu da SEO'nuzu olumsuz etkileyecektir.

Eğer karakter setinizi doğru bir şekilde uygularsanız, yüksek bir hemen çıkma oranını önlemeye yardımcı olursunuz, insanların size bağlantı vermemesi için bir neden sunmazsınız ve arama motorları içeriğinizi yanlış yorumlayamaz, bu da SEO çabalarınıza yardımcı olacaktır.