rainette: split_segments – R documentation

Pricing

Become an expert in R — Interactive courses, Cheat Sheets, certificates and more!

Get Started for Free

Documentation

rainette

split_segments

Split a character string or corpus into segments

Description

Split a character string or corpus into segments, taking into account punctuation where possible

Usage

split_segments(obj, segment_size = 40, segment_size_window = NULL)

## S3 method for class 'character'
split_segments(obj, segment_size = 40, segment_size_window = NULL)

## S3 method for class 'Corpus'
split_segments(obj, segment_size = 40, segment_size_window = NULL)

## S3 method for class 'corpus'
split_segments(obj, segment_size = 40, segment_size_window = NULL)

Arguments

`obj`	character string, quanteda or tm corpus object
`segment_size`	segment size (in words)
`segment_size_window`	window around segment size to look for best splitting point

Value

If obj is a tm or quanteda corpus object, the result is a quanteda corpus.

Examples

require(quanteda)
split_segments(data_corpus_inaugural)

rainette

The Reinert Method for Textual Data Clustering

v0.1.3

GPL (>= 3)

Authors

Julien Barnier [aut, cre], Florian Privé [ctb]

Initial release

2021-05-10

split_segments

Description

Usage

Arguments

Value

Examples

rainette

We don't support your browser anymore