Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1077235
  • 博文数量: 104
  • 博客积分: 3715
  • 博客等级: 中校
  • 技术积分: 1868
  • 用 户 组: 普通用户
  • 注册时间: 2006-04-30 08:38
文章分类

全部博文(104)

文章存档

2013年(1)

2012年(9)

2011年(41)

2010年(3)

2009年(3)

2008年(47)

分类:

2008-12-29 17:01:30

由于感冒的原因,下午头疼的要命,什么也不想干。所以就找了一段代码娱乐一下。没敢找大的,找了一个相对独立的很小的一段。

CmdLineParser.hs是ghc/compiler/main/下的一个小文件。

-----------------------------------------------------------------------------
-- 命令行参数分析器
-- 该命令行分析器可以用于StaticFlags以及DynFlags
-----------------------------------------------------------------------------

module CmdLineParser (
        processArgs, OptKind(..),
        CmdLineP(..), getCmdLineState, putCmdLineState,
        Flag(..), Deprecated(..),
        errorsToGhcException
  ) where

#include "HsVersions.h"

import Util
import Outputable
import Panic
import SrcLoc

-- Flag 数据结构的定义,每一个Flag用于描述一个命令行参数,它是该命令行参数
-- 的规格说明。其中m应该是一个Monad
-- 这里使用了面向对象的思想,将数据和处理数据的函数放在一起
data Flag m = Flag
    {
        flagName :: String,           -- 参数名,不包括开始的'-'
        flagOptKind :: (OptKind m),   -- 该参数后面可能有一些辅助的参数,
                                      -- 例如"-fxxx=12",这个动作用于处理辅助
                                      -- 参数
        flagDeprecated :: Deprecated  -- 该参数是否是"不建议使用"的
    }

-- 用于表示一个参数是否不建议使用,如果是,指出原因
data Deprecated = Supported | Deprecated String

-- 用于处理辅助参数的过程
data OptKind m                      -- 以-f参数为例
 = NoArg (m ())                     -- -f就是一个完整的参数
 | HasArg    (String -> m ())       -- -farg 或者 -f arg
 | SepArg    (String -> m ())       -- -f arg
 | Prefix    (String -> m ())       -- -farg
 | OptPrefix (String -> m ())       -- -f或者-farg (即arg是可选的)
 | OptIntSuffix (Maybe Int -> m ()) -- -f或者-f=n
 | IntSuffix (Int -> m ())          -- -f=n
 | PassFlag  (String -> m ())       -- -f,将"-f"整个参数传递给指定的动作
 | AnySuffix (String -> m ())       -- -f或者-farg,将"-farg"传递给指定的动作
 | PrefixPred    (String -> Bool) (String -> m ()) -- -farg, 并且使用第一个函数
                                                   -- 判断该arg部分是否合法
 | AnySuffixPred (String -> Bool) (String -> m ()) -- -f后者-farg,并且用第一个
                                                   -- 函数判断该参数整体是否合法

parseInt :: String -> Maybe Int
-- 分析如"433"或者"=342"的辅助参数,后面没有额外的字符(非空白字符)
--   "n"或者"=n"      => Just n
--   出现额外的字符   => Nothing
parseInt s = case reads s of
                ((n,""):_) -> Just n
                _          -> Nothing

dropEq :: String -> String
-- 去掉开始的'='符号
dropEq ('=' : s) = s
dropEq s         = s

-- 出错,未知的参数
unknownFlagErr :: String -> Either String a
unknownFlagErr f = Left ("unrecognised flag: " ++ f)

-- 出错,该参数缺少辅助参数
missingArgErr :: String -> Either String a
missingArgErr f = Left ("missing argument for flag: " ++ f)

-- 从[Flag m]指定的所有可能参数的规格说明中找出String指定参数,
-- 找到,返回Just (该arg中剩下的字符串,该参数对应的动作,该参数的deprecate)
-- 没找到,返回Nothing
findArg :: [Flag m] -> String -> Maybe (String, OptKind m, Deprecated)
findArg spec arg
  = case [ (removeSpaces rest, optKind, flagDeprecated flag)
         | flag <- spec,
           let optKind = flagOptKind flag,
           Just rest <- [maybePrefixMatch (flagName flag) arg],
           arg_ok optKind rest arg ]
          -- 这里使用了构造列表的“解释”形式
    of
        []      -> Nothing
        (one:_) -> Just one

-- 用于判断一个解析的参数是否合法
arg_ok :: OptKind t -> [Char] -> String -> Bool
arg_ok (NoArg _)            rest _   = null rest
arg_ok (HasArg _)           _    _   = True
arg_ok (SepArg _)           rest _   = null rest
arg_ok (Prefix _)           rest _   = notNull rest
arg_ok (PrefixPred p _)     rest _   = notNull rest && p (dropEq rest)
arg_ok (OptIntSuffix _)     _    _   = True
arg_ok (IntSuffix _)        _    _   = True
arg_ok (OptPrefix _)        _    _   = True
arg_ok (PassFlag _)         rest _   = null rest
arg_ok (AnySuffix _)        _    _   = True
arg_ok (AnySuffixPred p _)  _    arg = p arg

-- 分析一个参数 OptKind m 为findArg找到的该参数对应的规格说明中的动作;
-- 第一个String是findArg返回的该参数剩下的辅助参数;第二个String是当前
-- 被分析的参数的整体;[Located String]是当前参数后面的所有东西;
-- 返回可能是Left 错误信息;
-- 或者是Right (m (), 下面该分析的参数)
processOneArg :: OptKind m -> String -> String -> [Located String]
              -> Either String (m (), [Located String])
processOneArg action rest arg args
  = let dash_arg = '-' : arg -- 完整的带有'-'的参数
        rest_no_eq = dropEq rest -- 不带'='开始的辅助参数
    in case action of
        -- 不需要处理辅助参数,返回
        NoArg  a -> ASSERT(null rest) Right (a, args)

        -- f是处理辅助参数的函数,f rest_no_eq是m ()的动作
        -- 辅助参数可能在rest_no_eq里面: -farg
        -- 辅助参数可能在后面: -f arg
        HasArg f | notNull rest_no_eq -> Right (f rest_no_eq, args)
                 | otherwise    -> case args of
                                    [] -> missingArgErr dash_arg
                                    (L _ arg1:args1) -> Right (f arg1, args1)

        -- 类似于HasArg的第二种情况
        -- 这里的出错应该是 missingArgErr吧?
        SepArg f -> case args of
                        [] -> unknownFlagErr dash_arg
                        (L _ arg1:args1) -> Right (f arg1, args1)

        -- 类似于HasArg的第一种情况
        -- 这里的出错应该是 missingArgErr?
        Prefix f | notNull rest_no_eq -> Right (f rest_no_eq, args)
                 | otherwise  -> unknownFlagErr dash_arg

        -- 与上面类似,此时已经判断了rest_no_eq为合法的(findArg中)
        PrefixPred _ f | notNull rest_no_eq -> Right (f rest_no_eq, args)
                       | otherwise          -> unknownFlagErr dash_arg

        -- 将本参数作为整体传递给辅助参数处理函数
        PassFlag f  | notNull rest -> unknownFlagErr dash_arg
                    | otherwise    -> Right (f dash_arg, args)

        -- 该参数可能带有整型的辅助参数
        OptIntSuffix f | null rest                     -> Right (f Nothing,  args)
                       | Just n <- parseInt rest_no_eq -> Right (f (Just n), args)
                       | otherwise -> Left ("malformed integer argument in " ++  dash_arg)

        -- 该参数一定带有整型的辅助参数
        IntSuffix f | Just n <- parseInt rest_no_eq -> Right (f n, args)
                    | otherwise -> Left ("malformed integer argument in " ++  dash_arg)

        -- 带有可选的辅助参数,如果辅助参数不存在, rest_no_eq为""
        OptPrefix f       -> Right (f rest_no_eq, args)

        -- 将参数及其可能带有的辅助参数整体传递给辅助参数处理函数
        AnySuffix f       -> Right (f dash_arg, args)
        -- 与上面类似,此时已经判断了dash_arg是合法的(findArg中)
        AnySuffixPred _ f -> Right (f dash_arg, args)

-- 处理命令行参数的主函数
processArgs :: Monad m
            => [Flag m] -- 所有可能参数的规格说明
            -> [Located String]      -- 所有待处理的参数
            -> m (
                  [Located String],  -- 剩下的,未被处理的参数
                  [Located String],  -- 有错误的参数
                  [Located String]   -- 有警告的参数
                 )
processArgs spec args = process spec args [] [] []
  where
    process _spec [] spare errs warns =
      -- 由于每次发现错误等时都是添加在列表的前面,返回时需要将这些列表反转
      return (reverse spare, reverse errs, reverse warns)

    process spec (locArg@(L loc dash_arg@('-' : arg)) : args) spare errs warns =
      case findArg spec arg of -- 从规格说明中找到arg对应的项
        Just (rest, action, deprecated) ->
           let warns' = case deprecated of
                        Deprecated warning -> -- 如果该参数“不建议使用”,增加警告信息
                            L loc ("Warning: " ++ dash_arg ++ " is deprecated: " ++ warning) : warns
                        Supported -> warns
           in case processOneArg action rest arg args of
              -- 如果单个参数处理出错,增加错误信息,并继续处理后续的参数
              Left err            -> process spec args spare (L loc err : errs) warns'
              -- 如果单个参数处理正确,完成该参数对应的处理辅助参数的动作,
              -- 并继续处理后续的参数
              Right (action,rest) -> do action
                                        process spec rest spare errs warns'
        Nothing -> process spec args (locArg : spare) errs warns

    -- 对于其他的命令行参数(不是以'-'开始的那些),放到未被处理参数的列表中
    process spec (arg : args) spare errs warns =
      process spec args (arg : spare) errs warns

-- -----------------------------------------------------------------------------
-- 在命令行参数分析中用到的一个带有状态信息的Monad
-- 这个怎么用?或者说,什么时候用?

-- s 代表的是状态信息的类型,a是CmdLineP s这个Monad的结果、参数类型
-- 该Monad类型只有一个成员,它是一个以状态为参数,
-- 返回一个结构和一个后续状态的函数
-- 结构在一系列操作中显式的传递,而状态则同时隐式的传递
newtype CmdLineP s a = CmdLineP { runCmdLine :: s -> (a, s) }

instance Monad (CmdLineP s) where
        -- 将值a包装在Monad中,成员是:任给一个状态,返回a值和那个状态的常函数
        return a = CmdLineP $ \s -> (a, s)
        -- 绑定操作:将一个状态作为参数给操作结果的成员,等于首先把该状态传递给
        -- m的成员函数,得到结果a和新状态s',然后,以a为参数调用函数k,并得到
        -- 一个新的Monad,再以把s'传递给新的Monad的成员,得到最终的结果.
        m >>= k  = CmdLineP $ \s -> let
                (a, s') = runCmdLine m s
                in runCmdLine (k a) s'

getCmdLineState :: CmdLineP s s
getCmdLineState   = CmdLineP $ \s -> (s,s)
putCmdLineState :: s -> CmdLineP s ()
putCmdLineState s = CmdLineP $ \_ -> ((),s)

-- ---------------------------------------------------------------------
-- 辅助工具,将上面收集的错误信息转换成一个GhcException,以遍高层统一处理

errorsToGhcException :: [Located String] -> GhcException
errorsToGhcException errs =
   let errors = vcat [ ppr l <> text ": " <> text e | L l e <- errs ]
   in UsageError (showSDoc errors)


阅读(1637) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~