Skip to main content

Краткое введение в кодировку URL

HTML для начинающих - #1 - Введение (Май 2025)

HTML для начинающих - #1 - Введение (Май 2025)
Anonim

URL-адрес веб-сайта, также известный как «адрес веб-сайта», - это то, что кто-то входил в веб-браузер для доступа к определенному веб-сайту. Когда вы передаете информацию через URL-адрес, вам нужно убедиться, что он использует только определенные допустимые символы. Эти допустимые символы включают алфавитные символы, цифры и несколько специальных символов, имеющих смысл в строке URL. Любые другие символы, которые необходимо добавить в URL-адрес, должны быть закодированы, чтобы они не вызывали проблем во время поездки браузера, чтобы найти страницы и ресурсы, которые вы ищете.

Кодирование URL

Наиболее часто кодируемым символом в строке URL является персонаж. Вы видите этого персонажа всякий раз, когда вы видите знак плюса (+) в URL-адресе. Это символ пробела. Знак плюса действует как специальный символ, представляющий это пространство в URL-адресе. Наиболее распространенный способ, по которому вы увидите это, - это ссылка на mailto, которая включает тему. Если вы хотите, чтобы объект имел пробелы в нем, вы можете кодировать их как плюсы:

MAILTO: тема сообщения = это + будет + мой + предмет

Этот бит кодирующего текста передал бы тему «это мой вопрос». Символ «+» в кодировке будет заменен фактическим когда он отображается в браузере.

Чтобы кодировать URL-адрес, вы просто заменяете специальные символы своей строкой кодирования. Это почти всегда начинается с символа%.

Кодирование URL

Строго говоря, вы всегда должны кодировать любые специальные символы, найденные в URL-адресе. Одно важное замечание: если вы чувствуете себя немного запуганным из-за всех этих разговоров или кодировок, вы обычно не найдете каких-либо специальных символов в URL-адресе вне их обычного контекста, кроме данных формы.

Большинство URL-адресов используют простые символы, которые всегда разрешены, поэтому никакой кодировки не требуется вообще.

Если вы отправляете данные в CGI-скрипты с использованием метода GET, вы должны кодировать данные, поскольку они будут отправлены по URL-адресу. Например, если вы пишете ссылку для продвижения канала RSS, ваш URL-адрес должен быть закодирован для добавления к URL-адресу скрипта, который вы рекламируете.

Что нужно кодировать?

Любой символ, который не является алфавитным символом, числом или специальным символом, который используется вне его обычного контекста, должен быть закодирован на вашей странице. Ниже приведена таблица общих символов, которые можно найти в URL-адресе и их кодировке.

Зарезервированные URL-адреса URL-адресов

символНазначение по URL-адресукодирование
:Отдельный протокол (http) с адреса% 3B
/Отдельный домен и каталоги% 2F
#Отдельные анкеры%23
?Отдельная строка запроса% 3F
&Отдельные элементы запроса%24
@Разделите имя пользователя и пароль из домена%40
%Указывает кодированный символ%25
+Указывает пробел% 2B
Не рекомендуется в URL-адресах% 20 или +

Обратите внимание, что эти закодированные примеры отличаются от того, что вы найдете с помощью специальных символов HTML. Например, если вам нужно закодировать URL с символом амперсанда (&), вы должны использовать% 24, что и показано в приведенной выше таблице. Если вы пишете HTML и хотите добавить амперсанд в текст, вы не сможете использовать% 24. Вместо этого вы использовали бы & или же &, оба из которых будут выписывать & на странице HTML при визуализации. Сначала это может показаться запутанным, но в основном это разница между текстом, который появляется на самой странице, который является частью HTML-кода, и строкой URL-адреса, которая является отдельной сущностью и поэтому подвержена различным правилам.

Тот факт, что символ «&», как и многие другие персонажи, может появиться в каждом, не должен путать вас с различиями между ними.

Оригинальная статья Дженнифер Крынин. Под редакцией Джереми Жирарда.