Unicode அடிப்படையில் இணையதள முகவரிகளை எப்படி வடிகட்டுவது?

Unicode அடிப்படையில் இணையதள முகவரிகளை எப்படி வடிகட்டுவது, திரட்டுவது

#வடிகட்டி
#Filter by Language
வினா தமிழறிதம்

பொருள்: ஒரு இணையத்தை “தமிழ் Unicode” பயன்படுத்துகிறதா என்பதை கண்டறிந்து, அதன் URL-களை திரட்டி ஒரு பயன்பாட்டு டைரக்டரி/தரவுத்தளமாக உருவாக்குவது.

1 Like

இணையதளத்தின் முகப்பு பக்கம் பைத்தான் request மூலம் திறக்கவும்.

அதன் வரிகளை beautifulsoup மூலம் படிக்கவும்.

எழுத்துகளின் யுனிகோடு எண்ணை தமிழின் யுனிகோடு எண்களோடு ஒப்பிடவும்.

தமிழின் வரிசைக்குள் இருந்தால், அது தமிழ்த் தளம்.

1 Like