统一资源定位符(URL)就是访问网站内容的网站地址,如 www.geeksforgeks。组织 .但URL中允许使用某些字符,如字母A-Z和A-Z、数字0-9和少数特殊字符。它们可以按原样使用,但不在此列表中的其他字符在编码成合适的形式后使用。 URL编码是将URL转换为web浏览器可接受的有效格式的过程。URL编码通过将所有不允许的字符替换为%符号,后跟两个十六进制数字来实现。这两个十六进制值表示ASCII字符集中字符的数值。例如,URL中的空格是不可接受的,在编码时被“%20”或“+”符号替换。类似地,$符号被“%24”替换。
null
保留字符: 在URL中,某些字符有时具有特殊含义,可以用两种方式使用。例如,“/”字符是一个保留字符,当用作分隔URL路径的分隔符时,它具有特殊意义。在这里,通过将其编码为“%2F”来使用它。否则,当它没有特殊用途时,可以正常使用。
下面列出了许多保留字符:
性格 | 编码形式 |
---|---|
! | %21 |
* | %2A |
‘ | %27 |
( | %28 |
) | %29 |
; | %3B |
: | %3A |
@ | %40 |
& | %26 |
= | %3D |
+ | %2B |
$ | %24 |
, | %2C |
/ | %2F |
? | %3F |
# | %23 |
[ | %5B |
] | %5D |
有些字符需要编码,有些则不需要。下面是需要编码的字符组的分类。
- 安全字符: 字母数字,即0-9,a-z和a-z,特殊字符$,-,,,+,!,*,’,(,)是用于保留目的的保留字符。这些字符不需要编码。
- ASCII控制字符: Ii包括从00-1F(十六进制)(0-31十进制)到7F(127十进制)的字符。这些字符需要编码。
- 非ASCII控制字符: 它包括80-FF十六进制(128-255十进制)。这些字符需要编码。
- 保留字符: 这些字符用于特殊目的,需要进行编码。
- 不安全字符: 由于各种原因,URL中的这些字符可能会被误解。所以它需要编码。人物 < 和 > 是不安全的,因为它们被用作自由文本中URL周围的分隔符,引号(“”)是不安全的,因为在某些系统中它被用来分隔URL。 不安全字符列表如下所示:
性格 编码形式 空间 %20 “ %22 < %3C > %3E # %23 % %25 { %7B } %7D | %7C %5C ^ %5E ~ %7E [ %5B ] %5D
完整的URL编码字符列表如下所示:
性格 | 编码形式 |
---|---|
退格 | %08 |
标签 | %09 |
换行 | %0A |
c返回 | %0D |
空间 | %20 |
! | %21 |
“ | %22 |
# | %23 |
$ | %24 |
% | %25 |
& | %26 |
‘ | %27 |
( | %28 |
) | %29 |
* | %2A |
+ | %2B |
, | %2C |
– | %二维 |
. | %2E |
/ | %2F |
0 | %30 |
1. | %31 |
2. | %32 |
3. | %33 |
4. | %34 |
5. | %35 |
6. | %36 |
7. | %37 |
8. | %38 |
9 | %39 |
: | %3A |
; | %3B |
< | %3C |
= | %3D |
> | %3E |
? | %3F |
@ | %40 |
A. | %41 |
B | %42 |
C | %43 |
D | %44 |
E | %45 |
F | %46 |
G | %47 |
H | %48 |
我 | %49 |
J | %4A |
K | %4B |
L | %4C |
M | %4D |
N | %4E |
O | %4F |
P | %50 |
Q | %51 |
R | %52 |
s | %53 |
T | %54 |
U | %55 |
五、 | %56 |
W | %57 |
十、 | %58 |
Y | %59 |
Z | %5A |
[ | %5B |
%5C | |
] | %5D |
^ | %5E |
_ | %5F |
` | %60 |
A. | %61 |
B | %62 |
C | %63 |
D | %64 |
E | %65 |
F | %66 |
G | %67 |
H | %68 |
我 | %69 |
J | %6A |
K | %6B |
L | %6C |
M | %6D |
N | %6E |
o | %6F |
P | %70 |
Q | %71 |
R | %72 |
s | %73 |
T | %74 |
U | %75 |
五、 | %76 |
W | %77 |
十、 | %78 |
Y | %79 |
Z | %7A |
{ | %7B |
| | %7C |
} | %7D |
~ | %7E |
%7F | |
` | %E2%82%AC |
| %81 |
‚ | %E2%80%9A |
ƒ | %C6%92 |
„ | %E2%80%9E |
… | %E2%80%A6 |
† | %E2%80%A0 |
‡ | %E2%80%A1 |
ˆ | %CB%86 |
‰ | %E2%80%B0 |
Š | %C5%A0 |
‹ | %E2%80%B9 |
Œ | %C5%92 |
| %C5%8D |
Ž | %C5%BD |
| %8F |
| %C2%90 |
‘ | %E2%80%98 |
’ | %E2%80%99 |
“ | %E2%80%9C |
” | %E2%80%9D |
• | %E2%80%A2 |
– | %E2%80%93 |
— | %E2%80%94 |
˜ | %CB%9C |
™ | %E2%84 |
š | %C5%A1 |
› | %E2%80 |
œ | %C5%93 |
| %9D |
ž | %C5%BE |
Ÿ | %C5%B8 |
%C2%A0 | |
¡ | %C2%A1 |
¢ | %C2%A2 |
£ | %C2%A3 |
¤ | %C2%A4 |
¥ | %C2%A5 |
¦ | %C2%A6 |
§ | %C2%A7 |
¨ | %C2%A8 |
© | %C2%A9 |
ª | %C2%AA |
« | %C2%AB |
¬ | %C2%AC |
| %C2%AD |
® | %C2%AE |
¯ | %C2%AF |
° | %C2%B0 |
± | %C2%B1 |
² | %C2%B2 |
³ | %C2%B3 |
´ | %C2%B4 |
µ | %C2%B5 |
¶ | %C2%B6 |
· | %C2%B7 |
¸ | %C2%B8 |
¹ | %C2%B9 |
º | %C2%BA |
» | %C2%BB |
¼ | %公元前C2% |
½ | %C2%BD |
¾ | %C2%BE |
¿ | %C2%BF |
À | %C3%80 |
Á | %C3%81 |
 | %C3%82 |
à | %C3%83 |
Ä | %C3%84 |
Å | %C3%85 |
Æ | %C3%86 |
Ç | %C3%87 |
È | %C3%88 |
É | %C3%89 |
Ê | %C3%8A |
Ë | %C3%8B |
Ì | %C3%8C |
Í | %C3%8D |
Î | %C3%8E |
Ï | %C3%8F |
Ð | %C3%90 |
Ñ | %C3%91 |
Ò | %C3%92 |
Ó | %C3%93 |
Ô | %C3%94 |
Õ | %C3%95 |
Ö | %C3%96 |
× | %C3%97 |
Ø | %C3%98 |
Ù | %C3%99 |
Ú | %C3%9A |
Û | %C3%9B |
Ü | %C3%9C |
Ý | %C3%9D |
Þ | %C3%9E |
ß | %C3%9F |
à | %C3%A0 |
á | %C3%A1 |
â | %C3%A2 |
ã | %C3%A3 |
ä | %C3%A4 |
å | %C3%A5 |
æ | %C3%A6 |
ç | %C3%A7 |
è | %C3%A8 |
é | %C3%A9 |
ê | %C3%AA |
ë | %C3%AB |
ì | %C3%AC |
í | %C3%AD |
î | %C3%AE |
ï | %C3%AF |
ð | %C3%B0 |
ñ | %C3%B1 |
ò | %C3%B2 |
ó | %C3%B3 |
ô | %C3%B4 |
õ | %C3%B5 |
ö | %C3%B6 |
÷ | %C3%B7 |
ø | %C3%B8 |
ù | %C3%B9 |
ú | %C3%BA |
û | %C3%BB |
ü | %C3%BC |
ý | %C3%BD |
þ | %C3%BE |
ÿ | %C3%BF |
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END