如何在不使用biopython的情况下编写脚本来总结多fasta文件中的信息？

在不使用biopython的情况下编写脚本来总结多fasta文件中的信息，可以借助Python的内置库和一些常用的字符串处理函数来实现。以下是一个示例脚本：

import os

def parse_fasta(file_path):
    sequences = {}
    current_seq = None

    with open(file_path, 'r') as f:
        for line in f:
            line = line.strip()
            if line.startswith('>'):
                current_seq = line[1:]
                sequences[current_seq] = ''
            else:
                sequences[current_seq] += line

    return sequences

def summarize_fasta_files(directory):
    summary = {}

    for filename in os.listdir(directory):
        if filename.endswith('.fasta'):
            file_path = os.path.join(directory, filename)
            sequences = parse_fasta(file_path)
            
            for seq_name, seq_data in sequences.items():
                if seq_name not in summary:
                    summary[seq_name] = {'count': 0, 'total_length': 0}
                summary[seq_name]['count'] += 1
                summary[seq_name]['total_length'] += len(seq_data)

    return summary

fasta_directory = '/path/to/fasta/files'
summary = summarize_fasta_files(fasta_directory)

for seq_name, seq_summary in summary.items():
    print(f"Sequence {seq_name} appears in {seq_summary['count']} files with a total length of {seq_summary['total_length']}.")

这个脚本通过parse_fasta函数解析单个fasta文件并返回一个包含所有序列的字典。然后，summarize_fasta_files函数遍历指定目录下的所有fasta文件，将每个序列的出现次数和总长度记录在summary字典中。最后，输出每个序列的统计信息。

请注意，此脚本假定fasta文件的格式是标准的，即每个序列以>开头的行作为序列名称，后续行是序列数据。你需要将/path/to/fasta/files替换为实际的fasta文件所在目录路径。

这个脚本使用纯Python实现，不需要使用biopython或其他外部库。它适用于简单的fasta文件分析任务，如统计序列数量和长度。如果需要更复杂的fasta文件处理，建议使用专业的生物信息学工具库。