Chinaunix首页 | 论坛 | 博客
  • 博客访问: 364550
  • 博文数量: 284
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 1707
  • 用 户 组: 普通用户
  • 注册时间: 2014-05-14 16:38
文章分类

全部博文(284)

文章存档

2015年(6)

2014年(278)

我的朋友

分类: HTML5

2015-05-06 20:56:17

用的代理上网,就报错,以下是代码:

package main
 
import (
    "fmt"
    "io/ioutil"
    "net/http"
    "regexp"
    "strings"
)
 
func main() {
    resp, err := http.Get("")
    if err != nil {
        fmt.Println("http get error.")
    }
    defer resp.Body.Close()
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        fmt.Println("http read error")
        return
    }
 
    src := string(body)
 
    //将HTML标签全转换成小写
    re, _ := regexp.Compile("\\<[\\S\\s]+?\\>")
    src = re.ReplaceAllStringFunc(src, strings.ToLower)
 
    //去除STYLE
    re, _ = regexp.Compile("\\")
    src = re.ReplaceAllString(src, "")
 
    //去除SCRIPT
    re, _ = regexp.Compile("\\")
    src = re.ReplaceAllString(src, "")
 
    //去除所有尖括号内的HTML代码,并换成换行符
    re, _ = regexp.Compile("\\<[\\S\\s]+?\\>")
    src = re.ReplaceAllString(src, "\n")
 
    //去除连续的换行符
    re, _ = regexp.Compile("\\s{2,}")
    src = re.ReplaceAllString(src, "\n")
 
    fmt.Println(strings.TrimSpace(src))
}
阅读(736) | 评论(0) | 转发(0) |
0

上一篇:js显示当前时间

下一篇:我的java mvc

给主人留下些什么吧!~~