phoenixg 发表于 2011-7-19 15:54:04

求关于文本读取的算法

比如有一篇英文文章,分几个段落。如何把它转换成一个二维数组,第一维是每一个段落,第二维是该段落下的每一个句子。句子用.号识别分断。

jeongee 发表于 2011-7-19 15:58:47

段落是根据换行符来的?

phoenixg 发表于 2011-7-19 16:09:28

本帖最后由 phoenixg 于 2011-7-19 16:09 编辑

嗯 是的 ! br换行符

jeongee 发表于 2011-7-19 16:56:24

br是html里的,不知道你的文章到底是纯文本还是怎么的

visvoy 发表于 2011-7-19 18:16:24

explode foreach explode

phoenixg 发表于 2011-7-19 20:25:53

jeongee 发表于 2011-7-19 16:56 static/image/common/back.gif
br是html里的,不知道你的文章到底是纯文本还是怎么的

是纯文本,然后经nl2br转换过的,(顺便问下,有别的方法处理文章吗?)存进一个变量

phoenixg 发表于 2011-7-19 20:26:43

visvoy 发表于 2011-7-19 18:16 static/image/common/back.gif
explode foreach explode

太概要了,算法的实现怎么写

jeongee 发表于 2011-7-19 20:36:34

本帖最后由 jeongee 于 2011-7-19 20:37 编辑

就是V版主说的
先$段落数组 = explode('段落分隔符',$文章数据);
foreach($段落数组 as &$v)
{
      $v = array($v);
      $v['句子数组'] = explode('句子分隔符',$v);
}然后你print_r($段落数组);
这就行了
PS:自己把汉字部分转换掉哦{:1_1:}

visvoy 发表于 2011-7-20 09:02:01

ls整洁:hug:

phoenixg 发表于 2011-7-20 14:15:43

jeongee 发表于 2011-7-19 20:36 static/image/common/back.gif
就是V版主说的
先$段落数组 = explode('段落分隔符',$文章数据);
foreach($段落数组 as &$v)


谢谢!受教了
页: [1]
查看完整版本: 求关于文本读取的算法