从文件中提取HTML标记的LEX代码-yiteyi-C++库

Lex是一个生成词法分析器的计算机程序，由Mike Lesk和Eric Schmidt编写。 Lex读取指定词法分析器的输入流，并输出用C编程语言实现该词法分析器的源代码。 先决条件： Flex（快速词法分析器生成器）

null

推荐：请尝试你的方法 {IDE} 首先，在进入解决方案之前。

方法： 提取基于HTML中标记的编写方式。所有标签都包含在 < > 。这将设置从给定输入文件中提取HTML标记的规则。

输入文件：标签。txt 图片[1]-从文件中提取HTML标记的LEX代码-yiteyi-C++库

下面是从文件中提取HTML标记的实现：

                     /* Declaration section*/                   
                     %{                   
                     %}                   
                             
                     %                   
                     "<"                               [^>]*> {                               printf                               (                               "%s"                               , yytext); }                               /* if anything enclosed in                   
                                         these < > occur print text*/                   
                     . ;                               // else do nothing                   
                     %                   
                             
                     int                               yywrap(){}                   
                             
                     int                               main(                               int                               argc,                               char                               *argv[])                   
                     {                   
                                         // Open tags.txt in read mode                   
                                         extern                               FILE                               *yyin =                               fopen                               (                               "tags.txt"                               ,                               "r"                               );                   
                             
                                         // The function that starts the analysis                   
                                         yylex();                   
                             
                                         return                               0;                   
                     }                   

输出： 图片[2]-从文件中提取HTML标记的LEX代码-yiteyi-C++库

文章版权归作者所有，未经允许请勿转载。

THE END