利用Neo4j对电影评论进行深度学习情感分析

　　一个电影评论网站允许用户提交关于他们针对某部电影是喜欢还是不喜欢相关信息的评论。充分挖掘这些评论继而生成有价值的元数据（针对相关内容的）将给我们提供一个难得的机会，它可以让我们以一个大众化的方式来理解用户对于这部电影的情感，这是一件很酷的事情。我们可以对主观内容做出一个客观的分析，这样可以使我们能够更好地理解产品和服务的趋势，可以为消费者做出更好的决策。

　　实现这些的主要障碍是我们的结构和转换数据。当前最先进的技术包括Naive Bayes、Support Vector Machines以及Maximum Entropy。这些技术实施的挑战仍然是如何以最小的性能代价从文本中提取特征和结构化数据，这就是我决定要集中精力解决的问题。

　　我使用特征选择算法（详情点击这里），利用图形数据库Neo4j来解决数据转换和可用性的挑战，而最先进的自然语言解析算法的重点是关注句子结构，我决定为自然语言Grammar induction设计一个统计方法，主要是针对巨大文本语料库的概括，生成新特性，使用深度学习预测当下特性左边或右边的概率最高的新特性。

　　我假设短语“one of the worst”作为一组文本的特征已经被提取。这个词提取的原因是这个短语有最大的统计学相关性，这意味着这个短语在父短语之后有最佳的匹配机会。使用Neo4j我们可以确定产生这一词的继承特性。