统计一个英文文件中各单词出现的次数，用一位数组如何实现

做一个词频统计程序，该程序具有以下功能：
（1）可倒入任意英文文本文件
（2）统计该英文文件中单词数和各单词出现的频率（次数），并能将单词按字典顺序输出。
求各单词出现的频率（次数），求大神帮助，用一位数组实现
我有想法，不知道怎么做：
char temp[100] 是存放着从文件中读取的所有单词
定义一个数组 char a[10]
for(i=0;temp[i]!=' ';i++)
a[i]=temp[i]//先把第一个单词取出来存放在这个数组中
文件中单词存放形式如下：
good cat estimate(每个单词之间用一个空格隔开)
然后把第一个单词与原来的数组的每个单词进行比对
先看长度是否相同，若相同，看是否每个字母是否相同，若依然相同，则两个单词相等，以此类推
Int i;每比较完一个单词，i+2 相当于移到了第二个单词的第一个字母
就这样

举报该问题

其他回答

第1个回答推荐于2017-09-12

你的想法逻辑上不错，但是不可采取的。因为文件要是很大的话，能全部读进来吗？下面提供一个做参考。

//#include "stdafx.h"//vc++6.0加上这一行.
#include "stdio.h"
#include "ctype.h"
#include "string.h"
#include "stdlib.h"
struct WORD{
    char w[21];
    int n;
};
int main(void){
    int i,j,k,l;
    struct WORD w[1000];
    FILE *fp;
    if((fp=fopen("123.txt","r"))==NULL){
        printf("Open the file failure...\n");
        exit(0);
    }
    i=0;
    while(fscanf(fp,"%s",w[i].w),!feof(fp)){
        if(!isalpha(w[i].w[0]))
            strcpy(w[i].w,w[i].w+1);
        if(!isalpha(w[i].w[j=strlen(w[i].w)-1]))
            w[i].w[j]='\0';
        for(j=0;j<i;j++)
            if(strcmp(w[j].w,w[i].w)==0){
                w[j].n++;
                break;
            }
        if(j>=i)w[i++].n=1;
    }
    fclose(fp);
    for(k=0;k<i;k++){
        for(l=k,j=l+1;j<i;j++)
            if(strcmp(w[l].w,w[j].w)>0) l=j;
        if(l!=k){
            w[i]=w[l];
            w[l]=w[k];
            w[k]=w[i];
        }
        printf("%-20s%d\n",w[k].w,w[k].n);
    }
    return 0;
}

追问

好多地方看不懂，可以帮我加上注释吗？谢谢！
如下：
if(!isalpha(w[i].w[0]))
w[i].w
w[j=strlen(w[i].w)-1]
w[i++].n=1

追答

if(!isalpha(w[i].w[0]))//如果一个字符串的开头字符不是字母，则用下一行的语句抹掉它
strcpy(w[i].w,w[i].w+1);
if(!isalpha(w[i].w[j=strlen(w[i].w)-1]))//如果字符串的最后一个字符不是字母，用下一行清0
w[i].w[j]='\0';

追问

谢谢！

本回答被提问者和网友采纳

相似回答

...一维数组里输入一句英文,统计该句子里出现的单词个数答：int main(int argc,char *argv[]){char text[300];//定义一个空间较大的char数组存放输入的textint i,w;printf("Input a text...\n");fgets(text,300,stdin);//用fgets既可接收空格又能限制长度w=text[0]>='a' && text[0]<='z' || text[0]>='A' && text[0]<='Z';//开...

如何用python统计一个txt文件中各个单词出现的次数答：1、首先，定义一个变量，保存要统计的英文文章。2、接着，定义两个数组，保存文章中的单词，以及各单词的词频。3、从文章中分割出所有的单词，保存在数组中。4、然后，计算文章中单词的总数，保存在变量中。5、用for循环，统计文章中各单词的词频。6、最后，输出文章中各单词的词频。7、运行程序，电...

...一篇英文文章,统计其中每个单词分别出现了多少次,并可替换指定的单词...答：typedefine struct danchi{ char dc[100];//单词内容（如果你不嫌麻烦，也可以用指针动态申请数组大小，动态申请可以用malloc申请） int cnt;//计数变量（同一个单词第一次出现时置1，之后再次出现将首次出现的节点该成员累加，新建节点的该成员置-1） struct danchi *next;//链表指针 }...

C语言怎么统计相同单词出现次数?答：include <stdio.h>#include <string.h>#define M 1000#define N 20void main(){ char str1[M][N];//单词字串结果存放数组 char str2[M];//输入串或者用char *str2也可,这样可以 int strC[M];//单词字串计数数组.对应每个单词串,拥有一个计算器 int i=0,j=0,k=0,t...

...txt文件(英文诗) 并且计算单词数量每个单词出现次数 以及位置_百度...答：$num = $count{$word}; print "单词[$word]出现了[$num]次, 分别位于第[" . join(',', @{$position{$word}}) . "]行\n";}实际测试时注意一下拆分的依据，可能需要增加多种符号。如果或者直接使用\W来拆分： @words = split(/\W/, $line); 主要考虑You're之类的怎么算。

...如何读取字符串文件,并根据不同长度的单词统计总共出现的频率...答：如想统计一段文件中的英文单词出现次数。需实现以下功能：一、遍历字符串，通过分割符号空格及标点符号获取单词数组。二、大小写转换，把数组单词全部转换为大写或者小写（识别同一个单词不同大小写）。三、遍历单词数组，累加统计每个单词数量。（可遍历到第一个单词作为当前统计对象，之后每遍历到相同单词...

...从键盘读入一行文本,统计每个英文字母出现的次数。答：include#include#defineMAX100intmain(){charstr[MAX];//输入的字符串，最大长度是MAX-1，因为有一个字符串结束符inti=0,count[52]={0};//count数组用来存储各个字母出现的次数scanf("%s",str);while(str[i]!='\0'){if(str[i]>='a'&&str[i]count[str[i]-97+26]++;}if(str[i]>...

编写一个C语言程序:从键盘读入一行文本,统计每个英文字母出现的次数答：一、算法：1、循环读取字符，直到换行为止。对于每个字符，执行以下流程。2、判断是否为英文字母，即小写和大写两种。3、如果是英文字母，则统计个数。输入部分，可以存为数组，也可以每输入一个字符计算一次。二、参考代码：include <stdio.h>int main(){ int c; int cnt[52]={0}; whil...

大家正在搜

统计英文文本文件中单词个数 c语言统计文本文件中单词的个数统计文本中的单词个数统计大文件里的单词数 python统计单词出现次数 python统计每个单词个数 c语言文本英文单词统计统计大文件单词频率 word统计单词个数