用户
 找回密码
 入住 CI 中国社区
搜索
查看: 2105|回复: 9
收起左侧

[HELP] 求关于文本读取的算法

[复制链接]
发表于 2011-7-19 15:54:04 | 显示全部楼层 |阅读模式
比如有一篇英文文章,分几个段落。如何把它转换成一个二维数组,第一维是每一个段落,第二维是该段落下的每一个句子。句子用.号识别分断。
发表于 2011-7-19 15:58:47 | 显示全部楼层
段落是根据换行符来的?
 楼主| 发表于 2011-7-19 16:09:28 | 显示全部楼层
本帖最后由 phoenixg 于 2011-7-19 16:09 编辑

嗯 是的 ! br换行符
发表于 2011-7-19 16:56:24 | 显示全部楼层
br是html里的,不知道你的文章到底是纯文本还是怎么的
发表于 2011-7-19 18:16:24 | 显示全部楼层
explode foreach explode
 楼主| 发表于 2011-7-19 20:25:53 | 显示全部楼层
jeongee 发表于 2011-7-19 16:56
br是html里的,不知道你的文章到底是纯文本还是怎么的

是纯文本,然后经nl2br转换过的,(顺便问下,有别的方法处理文章吗?)存进一个变量
 楼主| 发表于 2011-7-19 20:26:43 | 显示全部楼层
visvoy 发表于 2011-7-19 18:16
explode foreach explode

太概要了,算法的实现怎么写
发表于 2011-7-19 20:36:34 | 显示全部楼层
本帖最后由 jeongee 于 2011-7-19 20:37 编辑

就是V版主说的
先$段落数组 = explode('段落分隔符',$文章数据);
foreach($段落数组 as &$v)
{
        $v = array($v);
        $v['句子数组'] = explode('句子分隔符',$v[0]);
}然后你print_r($段落数组);
这就行了
PS:自己把汉字部分转换掉哦
发表于 2011-7-20 09:02:01 | 显示全部楼层
ls整洁
 楼主| 发表于 2011-7-20 14:15:43 | 显示全部楼层
jeongee 发表于 2011-7-19 20:36
就是V版主说的
先$段落数组 = explode('段落分隔符',$文章数据);
foreach($段落数组 as &$v)

谢谢!受教了

本版积分规则