从文件中提取HTML标记的LEX代码

Lex是一个生成词法分析器的计算机程序,由Mike Lesk和Eric Schmidt编写。 Lex读取指定词法分析器的输入流,并输出用C编程语言实现该词法分析器的源代码。 先决条件: Flex(快速词法分析器生成器)

null

方法: 提取基于HTML中标记的编写方式。所有标签都包含在 < > 。这将设置从给定输入文件中提取HTML标记的规则。

输入文件:标签。txt 图片[1]-从文件中提取HTML标记的LEX代码-yiteyi-C++库

下面是从文件中提取HTML标记的实现:

/* Declaration section*/
%{
%}
%
"<" [^>]*> { printf ( "%s" , yytext); } /* if anything enclosed in
these < > occur print text*/
. ; // else do nothing
%
int yywrap(){}
int main( int argc, char *argv[])
{
// Open tags.txt in read mode
extern FILE *yyin = fopen ( "tags.txt" , "r" );
// The function that starts the analysis
yylex();
return 0;
}


输出: 图片[2]-从文件中提取HTML标记的LEX代码-yiteyi-C++库

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享